3.2.1. 協力性の進化

13
3.2.1. 協協協協協協 協協協協協協協協協 協協協 () 2000.07.06

description

3.2.1. 協力性の進化. 社会心理学特殊講義(高木) 2000.07.06. Axelrod(1984) の分析. 一種の進化ゲーム状況 戦略間のトーナメント tit-for-tat 戦略( TFT) の優越 解析 TFT を取り合う(→ CC) ことが Nash 均衡解になる。 Collective Stable Starategy ≒ESS) TFT の頑健性 限界 どの戦略が勝つかは戦略分布による。 ノイズを考えない。 多数の戦略が競い合う状況ではない。. Axelrod(1984) 以後の展開(1) :ノイズのある状況. - PowerPoint PPT Presentation

Transcript of 3.2.1. 協力性の進化

Page 1: 3.2.1.  協力性の進化

3.2.1. 協力性の進化

社会心理学特殊講義(高木)2000.07.06

Page 2: 3.2.1.  協力性の進化

囚人のジレンマ(D)協力(C)と非協力

CC=相互サポート一種の(限定)交換

均衡解→静的ゲーム DD

Meta Game, Super Game への→ CC DD 拡張 が とともに均衡

解に含まれる。

━ ━ ━ ━ ━ ━ ━ ━ ━            Self Other─ ─ ─ ─ ─ ─ ─ ─ ─

give 0 2not give 1 0

━ ━ ━ ━ ━ ━ ━ ━ ━Player 2

2

1

give not give

give

not give

Player 12

10

0

3

3

Page 3: 3.2.1.  協力性の進化

Axelrod(1984) の分析

一種の進化ゲーム状況 戦略間のトーナメント

• tit-for-tat 戦略 (TFT) の優越 解析

• TFT を取り合う(→ CC )ことが Nash 均衡解になる。

• Collective Stable Starategy ESS)≒ TFT の頑健性 限界

• どの戦略が勝つかは戦略分布による。• ノイズを考えない。• 多数の戦略が競い合う状況ではない。

Page 4: 3.2.1.  協力性の進化

Axelrod(1984) 以後の展開 (1): ノイズのある状況

ノイズがある状況では TFT より「寛容な」戦略が有利である可能性 右図の p : C 返礼確率 右図の q : D に C を

返す確率 厳密な TFT :協力の優

越への触媒作用

Page 5: 3.2.1.  協力性の進化

Axelrod(1984) 以後の展開(2)

パブロフ戦略 (Win-stay Lose-change): TFT より成績が良い、という結果( Nowak, M. & Sigmund, K., 1993 )

非寛容な Gradual が強いという説( Beaufils, Delahaye & Mathieu, 1996 ) : 相手が裏切った全回数を、相手が裏切るたびに裏切り返す。

Open end な進化 (Lindgren, 1991)• ノイズの存在+遺伝子操作によって戦略の次元が増加できる• 何らかのESSに到達 - 9割• open end な進化    - 1割TFT

Pavlov ESS の1種

Page 6: 3.2.1.  協力性の進化

セルオートマトンの適用例(Hegselmann, 1996a,b)

エージェントをセルで表現• エージェントはリスクを抱える。• サポート関係の成立のシミュ

レーション結果

• サポートのネットワークが出現• 近隣間でサポート関係が生じる。• リスク水準が似通ったエージェ

ント間でサポート関係が生じやすい。

Page 7: 3.2.1.  協力性の進化

参考文献 Axelrod, R., 1984, The Evolution of Cooperation. NY: Basic Books. アクセルロッド 松田裕之

( 訳 )  『つきあい方の科学』、 1987 、HBJ出版局 . Beaufils, B., Delahaye, J-P., Mathieu, P. (1996) Our meeting with Gradual. Artificial-Life-V, MIT

Press, Pp.202-209. Hegselmann, R., 1996a, Understanding social dynamics. See Troitzsch et al. (1996), Pp.282-306. Hegselmann, R., 1996b, Cellular automata in the social sciences. In R. Hegselmann, U. Mueller &

K.G. Troitzsch (Eds.), Modelling and Simulation in the Social Sciences from the Philosophy of Science Point of View. Dordrecht: Kluwer Academic Publishers, Pp.209-233.

Lindgren, K. (1991) Evolutionary phenomena in simple dynamics. Artificial Life-II. Addison-Wesley, Pp.295-312.

Nowak, M. & May, R.M., 1992, Evolutionary games and spatial chaos. Nature, 359, 29, 826-9. Nowak, M., May, R.M. & Sigmund, K., 1995, The arithmetics of mutual help. Scientific American,

June, 50-55. Nowak, M. & Sigmund, K., 1992, Tit for tat in heterogeneous populations. Nature, 355, 16, 250-3. Nowak, M. & Sigmund, K., 1993, A strategy of win-stay, lose-shift that outperforms tit-for-tat in the

Prisoner's Dilemma game. Nature, 364, 1, 568-3. Suleiman, R., 1996, Simulating cooperation and competition: Present state and future objectives.

See Troitzsch et al. (1996), Pp.264-281.

Page 8: 3.2.1.  協力性の進化

余談:社会的交換ゲーム

ゲーム(シミュレーション)のルール 100人のプレイヤー ゲームの1ラウンド = 試行の繰返し プレイヤーは各試行で資源を保有する。 資源を自由に分割し、他者ないし自分に与える。 各試行でのプレイヤーの利得=その試行で受け取った資源量の和 他者から得た資源は自分の資源より価値がある。

• 囚人のジレンマ ラウンドでのプレイヤーの利得は試行ごとの利得和。ただし後の試行の利得

は割引かれる。 ラウンドごとに、利得の下位者の戦略は上位者の戦略と入代わる(進化)。

囚人のジレンマのシミュレーションとの違い 予算制約:協力の範囲を無制限に拡張することはできない。 与える量を自由に調節できる。

Page 9: 3.2.1.  協力性の進化

限定交換戦略• NonCoop :孤立主義者

– 決して他者に与えない。• Saint :聖人

– すべてを無条件に他者に与える。• Recp :お返し戦略 ~ 返報規範

– 最初のうちは自発的に他者に資源を与える。– 自分と相手との差し引き勘定を計算、負債の2倍返しをする。 → 交換の永続

• TFT :仲間作り戦略 ~  tit for tat– 最初のうちは自発的に他者に資源を与える。– 資源をくれる相手を「仲間」と認定する。仲間には常に与える。– 2度裏切った(資源をくれない)相手は2度と仲間とは認めない。 →同類

を識別• 情報構造 - 自分の交換履歴の情報だけを利用

Page 10: 3.2.1.  協力性の進化

A

B

A

B

-1

-1

-1

-1

-1

-1

-1

+1

+1

+1

+1

+1

+1

+1

1 2 2 2 2 2 2

1 1 1 1 1 1 1

1 1 1 1 1 1

返報戦略 (Recp)

仲間作り戦略 (TFT)

2 2

2 2

1 1

Page 11: 3.2.1.  協力性の進化

分析:4戦略の比較 相手が NonCoop だけなら、 Recp 、 TFT は勝利できる。

• Recp 8 vs NonCoop 92 → Recp 100

• TFT 7 vs NonCoop 93 → TFT 100

TFT が4戦略中最強。 Recp は Saint に弱い。

• 同類識別能力の欠如SaintNonCoopRecp TFT

戦略

0

100

200

300

400

500

平均

利得 TFT

RecpNonCoopSaint

Recp, NonCoop, Saint 図2: の循環 -1 TFT 図2 : が参加した場合

Page 12: 3.2.1.  協力性の進化

分析:改良返報戦略 Recp2 :改良型返報戦略

同類を識別できる 。 得点能力は TFT にせまる ( 図3 ) 。

保有資源の不確実性 TFT は不確実なほど得点が低下 Recp2 は不確実性の影響を受けない(図3-

1)。 シミュレーション

条件• 確実:毎試行資源 10• 低不確実: 15/5• 高不確実: 20/0

確実条件 →  TFT が勝利 低/高不確実条件 →  Recp2 が勝利

Saint NonCoop Recp2 TFT戦略

0

100

200

300

400

500

平均

利得 TFT

Recp2NonCoopSaint

図3:戦略の平均利得

確実 低不確実 高不確実0

100200300400500

TFTRecp2

-1図3 :戦略の平均利得

Page 13: 3.2.1.  協力性の進化

0

20

40

60

80

100

確実条件

TFTRecp2

NonCoop

0

20

40

60

80

100TFT

Recp2

NonCoop

低不確実条件0

20

40

60

80

100 TFT

Recp2

NonCoop

高不確実条件