3.2.1. 協力性の進化

3.2.1. 協力性の進化

社会心理学特殊講義（高木）2000.07.06

囚人のジレンマ(D)協力（Ｃ）と非協力

CC＝相互サポート一種の（限定）交換

均衡解→静的ゲームＤＤ

Meta Game, Super Game への→ CC DD 拡張がとともに均衡

解に含まれる。

━ ━ ━ ━ ━ ━ ━ ━ ━　　　　　　　　　 Self Other─ ─ ─ ─ ─ ─ ─ ─ ─

give 0 2not give 1 0

━ ━ ━ ━ ━ ━ ━ ━ ━Player 2

2

1

give not give

give

not give

Player 12

10

0

3

3

Axelrod(1984) の分析

一種の進化ゲーム状況戦略間のトーナメント

• tit-for-tat 戦略 (TFT) の優越解析

• TFT を取り合う（→ CC ）ことが Nash 均衡解になる。

• Collective Stable Starategy ESS)≒ TFT の頑健性限界

• どの戦略が勝つかは戦略分布による。• ノイズを考えない。• 多数の戦略が競い合う状況ではない。

Axelrod(1984) 以後の展開 (1): ノイズのある状況

ノイズがある状況では TFT より「寛容な」戦略が有利である可能性右図の p : C 返礼確率右図の q : D に C を

返す確率厳密な TFT ：協力の優

越への触媒作用

Axelrod(1984) 以後の展開(2)

パブロフ戦略 (Win-stay Lose-change): TFT より成績が良い、という結果（ Nowak, M. & Sigmund, K., 1993 ）

非寛容な Gradual が強いという説（ Beaufils, Delahaye & Mathieu, 1996 ） : 相手が裏切った全回数を、相手が裏切るたびに裏切り返す。

Open end な進化 (Lindgren, 1991)• ノイズの存在＋遺伝子操作によって戦略の次元が増加できる• 何らかのＥＳＳに到達　－　９割• open end な進化　　　－　１割TFT

Pavlov ESS の１種

セルオートマトンの適用例(Hegselmann, 1996a,b)

エージェントをセルで表現• エージェントはリスクを抱える。• サポート関係の成立のシミュ

レーション結果

• サポートのネットワークが出現• 近隣間でサポート関係が生じる。• リスク水準が似通ったエージェ

ント間でサポート関係が生じやすい。

参考文献 Axelrod, R., 1984, The Evolution of Cooperation. NY: Basic Books. アクセルロッド　松田裕之

( 訳 ) 　『つきあい方の科学』、 1987 、ＨＢＪ出版局 . Beaufils, B., Delahaye, J-P., Mathieu, P. (1996) Our meeting with Gradual. Artificial-Life-V, MIT

Press, Pp.202-209. Hegselmann, R., 1996a, Understanding social dynamics. See Troitzsch et al. (1996), Pp.282-306. Hegselmann, R., 1996b, Cellular automata in the social sciences. In R. Hegselmann, U. Mueller &

K.G. Troitzsch (Eds.), Modelling and Simulation in the Social Sciences from the Philosophy of Science Point of View. Dordrecht: Kluwer Academic Publishers, Pp.209-233.

Lindgren, K. (1991) Evolutionary phenomena in simple dynamics. Artificial Life-II. Addison-Wesley, Pp.295-312.

Nowak, M. & May, R.M., 1992, Evolutionary games and spatial chaos. Nature, 359, 29, 826-9. Nowak, M., May, R.M. & Sigmund, K., 1995, The arithmetics of mutual help. Scientific American,

June, 50-55. Nowak, M. & Sigmund, K., 1992, Tit for tat in heterogeneous populations. Nature, 355, 16, 250-3. Nowak, M. & Sigmund, K., 1993, A strategy of win-stay, lose-shift that outperforms tit-for-tat in the

Prisoner's Dilemma game. Nature, 364, 1, 568-3. Suleiman, R., 1996, Simulating cooperation and competition: Present state and future objectives.

See Troitzsch et al. (1996), Pp.264-281.

余談：社会的交換ゲーム

ゲーム（シミュレーション）のルール１００人のプレイヤーゲームの１ラウンド　＝　試行の繰返しプレイヤーは各試行で資源を保有する。資源を自由に分割し、他者ないし自分に与える。各試行でのプレイヤーの利得＝その試行で受け取った資源量の和他者から得た資源は自分の資源より価値がある。

• 囚人のジレンマラウンドでのプレイヤーの利得は試行ごとの利得和。ただし後の試行の利得

は割引かれる。ラウンドごとに、利得の下位者の戦略は上位者の戦略と入代わる（進化）。

囚人のジレンマのシミュレーションとの違い予算制約：協力の範囲を無制限に拡張することはできない。与える量を自由に調節できる。

限定交換戦略• NonCoop ：孤立主義者

– 決して他者に与えない。• Saint ：聖人

– すべてを無条件に他者に与える。• Recp ：お返し戦略　～　返報規範

– 最初のうちは自発的に他者に資源を与える。– 自分と相手との差し引き勘定を計算、負債の２倍返しをする。 →　交換の永続

• TFT ：仲間作り戦略　～　 tit for tat– 最初のうちは自発的に他者に資源を与える。– 資源をくれる相手を「仲間」と認定する。仲間には常に与える。– ２度裏切った（資源をくれない）相手は２度と仲間とは認めない。 →同類

を識別• 情報構造 - 自分の交換履歴の情報だけを利用

A

B

A

B

-1

-1

-1

-1

-1

-1

-1

+1

+1

+1

+1

+1

+1

+1

1 2 2 2 2 2 2

1 1 1 1 1 1 1

1 1 1 1 1 1

返報戦略 (Recp)

仲間作り戦略 (TFT)

2 2

2 2

1 1

分析：４戦略の比較相手が NonCoop だけなら、 Recp 、 TFT は勝利できる。

• Recp 8 vs NonCoop 92 → Recp 100

• TFT 7 vs NonCoop 93 → TFT 100

TFT が４戦略中最強。 Recp は Saint に弱い。

• 同類識別能力の欠如SaintNonCoopRecp TFT

戦略

0

100

200

300

400

500

平均

利得 TFT

RecpNonCoopSaint

Recp, NonCoop, Saint 図２：の循環 -1 TFT 図２：が参加した場合

分析：改良返報戦略 Recp2 ：改良型返報戦略

同類を識別できる。得点能力は TFT にせまる ( 図３ ) 。

保有資源の不確実性 TFT は不確実なほど得点が低下 Recp2 は不確実性の影響を受けない（図３－

１）。シミュレーション

条件• 確実：毎試行資源 10• 低不確実： 15/5• 高不確実： 20/0

確実条件　→　 TFT が勝利低／高不確実条件 →　 Recp2 が勝利

Saint NonCoop Recp2 TFT戦略

0

100

200

300

400

500

平均

利得 TFT

Recp2NonCoopSaint

図３：戦略の平均利得

確実低不確実高不確実0

100200300400500

TFTRecp2

-1図３：戦略の平均利得

0

20

40

60

80

100

確実条件

TFTRecp2

NonCoop

0

20

40

60

80

100TFT

Recp2

NonCoop

低不確実条件0

20

40

60

80

100 TFT

Recp2

NonCoop

高不確実条件

3.2.1. 協力性の進化

Documents

Transcript of 3.2.1. 協力性の進化