2016 4 14 4 17 第3 章：合理性と知識 · マッチング・マーケットデザイン...

1

2016 年 4 月 14 日（4 月 17 日修正）

第 3 章：合理性と知識均衡概念：プレーヤーはゲームをどのようにプレイするか？均衡概念を理解するための三つのポイント

合理的に自身の利益を「最大化」「知識」を活用して相手プレーヤーの戦略を「合理的に」予想「経験、慣習」を使って、相手プレーヤーの戦略を「正しく」予想

第３章は最初の２ポイント、合理性と知識、から均衡概念にアプローチ優位戦略劣位戦略逐次消去最適反応合理化戦略＊第４章にて、経験、慣習の観点からも均衡概念にアプローチ！

ナッシュ均衡

2

3.1. 優位戦略（Dominant Strategy）, 劣位戦略（Dominated Strategy）

例：囚人のジレンマ

c d c 1 1 -1 2 d 2 -1 0 0

相手の選択に関係なくｄがベスト相手がｃの時 2 1 ｄを選択した方が得相手が d の時 0 1 ｄを選択した方がやはり得

3

優位戦略（Dominant Strategy）の定義任意の標準形ゲーム ( , , )N S u において、プレーヤー i N の戦略 i is S は、以下の条件

をみたす時、弱い意味で優位戦略（Weakly Dominant Strategy）である： For every \ { }i i is S s ,

( , ) ( , )i i i i i iu s s u s s for all \{ }( )i j j N i is s S . あるいは、優位戦略（Dominant Strategy）である：

For every \ { }i i is S s ,

( , ) ( , )i i i i i iu s s u s s for all \{ }( )i j j N i is s S , and

( , ) ( , )i i i i i iu s s u s s for some \{ }( )i j j N i is s S . あるいは、強い意味で優位戦略（Strictly Dominant Strategy）である：

For every \ { }i i is S s ,

( , ) ( , )i i i i i iu s s u s s for all \{ }( )i j j N i is s S .

[相手の戦略に無関係に常に is がベスト] ⇔ [プレーヤー iにとって is は優位戦略]

4

劣位戦略（Dominated Strategy）の定義（純粋戦略ヴァージョン：第 5 章にて混合戦略ヴァージョン説明）標準形ゲーム ( , , )N S u において、プレーヤー i N の戦略 i is S は、以下の条件をみた

す時、（強い意味で）劣位戦略（Strictly Dominated Strategy）である：

There exists another strategy for player i , \ { }i i is S s , such that

( , ) ( , )i i i i i iu s s u s s for all i is S .

あるいは、（弱い意味で）劣位戦略（Weakly Dominated Strategy）である:

There exists another strategy for player i , \ { }i i is S s , such that

( , ) ( , )i i i i i iu s s u s s for all i is S , and

( , ) ( , )i i i i i iu s s u s s for some i is S .

[別の戦略 isの方が is よりも、相手の戦略に無関係に、常に得である]

⇕ [プレーヤー iにとって is は劣位戦略]

5

非劣位戦略（Undominated Strategy）：劣位でない戦略（弱い意味、強い意味）

優位戦略は必ず非劣位である。しかし逆は必ずしも真ならず強い意味での優位戦略が存在するならば、それ以外の戦略はみな

強い意味で劣位戦略優位戦略が存在するならば、それ以外の戦略はみな

弱い意味で劣位戦略

6

例：囚人のジレンマ

c d c 1 1 -1 2 d 2 -1 0 0

ｄは（強い意味で）優位戦略, ｃは（強い意味で）劣位戦略よって、戦略プロファイル（d,d）がプレイされるジレンマ：戦略プロファイル（c,c）の方が（d,d）よりもパレート優位 (1,1) (0,0)

例：隣の親父と騒音バトル（ワグナーvs 演歌）囚人のジレンマによるモデル化：c小音量、d 大音量実際には、互いに協調して（c,c）が実現されるかもしれないこの場合、囚人のジレンマは不適切なモデルどのように協調するのか？

cやd 以外に協調のための行動や戦略があるのか？

7

ある戦略が優位戦略ならば、合理的プレーヤーはそれをプレイする。この際、プレーヤーは「相手がどの戦略をプレイするか」について予想を立てなくていいし、相手の利得関数についての知識を使わなくてもいい。ある戦略が劣位戦略なら合理的プレーヤーはそれをプレイしない。「相手がどの戦略をプレイするか」について予想を立てなくても、相手の利得関数についての知識を使わなくても、合理的プレーヤーは劣位戦略を排除できる。優位戦略や劣位戦略はどの標準形ゲームにも存在するわけではない以下のゲームには優位戦略も劣位戦略もない。（すべて非劣位戦略。要チェック） Matching Pennies

L R L 1 -1 -1 1 R -1 1 1 -1

グーチョキパーグーチョキパー

グー 0 0 1 -1 -1 1 チョキ -1 1 0 0 1 -1 パー 1 -1 -1 1 0 0

Coordination Game L R

L 1 1 0 0 R 0 0 1 1

8

3.2. 優位戦略が存在する例

3.2.1. 公共財自発的供給（囚人のジレンマ）

供給するしない供給する２－C ２－C １－C １しない１１－C ００

公共財の供給コスト C 公共財１単位の便益１（相手にも便益１）

1C の時「供給しない」が優位戦略さらに 2 1C ならば「ふたりとも供給する」がパレート最適。しかし達成されない

9

3.2.2. せり上げ入札（あるいは二位価格入札）

{1,2}N [0, )iS

1 2( ) 10000u s s and 2 ( ) 0u s if 1 2s s

1( ) 0u s and 2 1( ) 8000u s s if 1 2s s

1 21( ) (10000 )2u s s and 2 1

1( ) (8000 )2u s s if 1 2s s

「財に対する評価（入札者１は１０００円、入札者２は８０００円）を「正直に」指値する

（その額までせり上げに応じる）」が優位戦略になる！証明：入札者１について考えよう。（入札者２については同様。）・入札者２の指値 2s が１００００円以上としよう。指し値 1s を 2s 以上にすると、勝者になり（なることがあり）、自身の真の財評価以上の 2s 円を払うことに

なり、非正の利得 110000 0s である。指し値 1s を 2s 未満にすれば、競りに負けて、利得ゼロになる。

正直に指値（ 1 10000s ）すれば、利得ゼロであるから、ベストである。・入札者２の指値 2s が１００００より低いとしよう。指し値 1s を 2s 以上にすると、勝者になり、自身の真の財評価より低い 2s 円を払うことになり、正の利得

110000 0s である。指し値 1s を 2s 未満にすれば、競りに負けて、利得ゼロになる。正直に指値

（ 1 10000s ）すれば、正の利得 110000 0s であるから、ベストである。 Q.E.D.

10

3.2.2. マッチング・マーケットデザイン病院と研修医のマッチング問題：

Gale-Shapley (Differed Acceptance) Algorism：DA アルゴリズム全病院は「好きな研修医についての順位表」を提出 ex. (1,3,4,2) 各研修医も「好きな病院についての順位表」を提出 ex. (B,C,A,D) 研修医は、１、２、３、４の順に、一番好きな病院を指名し、「暫定マッチ」をきめていく指名された病院は、既に暫定マッチしている研修医より好みなら、既存の暫定マッチを解約して、指名した研修医と新たに暫定マッチを組みなおす。もはや暫定マッチが新たにきまったり、組みなおしたりする余地がなくなった時点でマッチング終了

病院 A 病院 B 病院 D病院 C

研修医１研修医２研修医３研修医４

11

数値例

マッチング終了！パレート最適達成

病院 A4 3 2 1

病院 B 1 2 3 4

病院 D4 1 2 3

病院 C 2 4 3 1

研修医１ A B C D

研修医２ B D A C

研修医３ D B C A

研修医４ A C D B

病院 A4 3 2 1

病院 B 1 2 3 4

病院 D4 1 2 3

病院 C 2 4 3 1


研修医２B D A C



病院 A4 3 2 1

病院 B 1 2 3 4

病院 D4 1 2 3

病院 C 2 4 3 1





病院 A4 3 2 1

病院 B 1 2 3 4

病院 D4 1 2 3

病院 C 2 4 3 1


研修医２B D A C



病院 A4 3 2 1

病院 B 1 2 3 4

病院 D4 1 2 3

病院 C 2 4 3 1





12

問：各研修医に順位表を自己申告させる際にうそをつくことができるとする。しかし、DAアルゴリズムのもとでは、正直に順位表を申告することが優位戦略になる。このことを確か

めよ。＊DA アルゴリズムは「進振り」にも使えそう（学部 VS 学生）。東大で検討中。

13

3.2.3. 検索連動型広告（スポンサードサーチ）オークショングーグル台頭時期の収入源はほぼすべてこの広告収入！

14

検索結果画面ごとに複数の広告バナー（ポジション）：優劣あり「オークション」によって広告バナーを広告主に割り当てている

ネットユーザーが広告バナーをクリックするたびに、広告主は検索エンジンにお金を払う金額を指値して、以下のような封印入札が行われる１番高い指値の広告主が１番いい（一番クリックされやすい）広告バナーを獲得２番目が２番目にいいバナーを獲得各ワードごとにオークション膨大なワード、膨大なユーザー：膨大な広告収入スポンサードサーチオークションにおいて、広告主が支払う金額をどのように設定するかは、

入札参加者の行動に大きな影響を与える

15

問（スポンサードサーチ・オークション）検索エンジン G○○GLE が、あるキーワードの検索画面上に広告バナー（枠）を２つ用意したところ、

３つの企業が広告枠獲得の意思を示した。２つのうち上側の広告枠の方がクリックされやすく、広告枠

1,2k が一定期間にクリックされる回数の期待値は企業によらずkb （

1 2b b ）とする。企業

1,2,3i にとって１クリック当 0i の価値がある。したがって広告枠 1,2k のもつ期待価値は

kib である。各企業は高々１枠しか需要しない。

このとき次のようなルールのオークションに従って広告枠の割り当てと支払額を決める。各企業に１

クリックあたり何円払えるかを指値してもらう。この指値を [0, )is と表す。一番高い指値をした企業

に広告枠１を、二番目に高い指値をした企業に広告枠２を、割り当てる。（同じ金額を指値した場合、公

正なくじによって順位を決定する。）支払額は、一番高い指値をした企業は

２位の指値× 1 2b b ＋３位の指値×2b 」

二番目に高い指値をした企業は「３位の指値×

2b 」最下位の企業は 0、と定める。（１）標準形ゲームで表現せよ。（２）正直な表明 i is が（弱い意味で）優位戦略であることを示せ。

16

宿題２：問１：3.2.2.（マッチングマーケットデザイン）の問を解答せよ。問２：3.2.3.（スポンサードサーチ）の問を解答せよ。

2016 4 14 4 17 第3 章：合理性と知識 · マッチング・マーケットデザイン...

Documents

Transcript of 2016 4 14 4 17 第3 章：合理性と知識 · マッチング・マーケットデザイン...