2016 4 14 4 17 第3 章:合理性と知識 · マッチング・マーケットデザイン...
Transcript of 2016 4 14 4 17 第3 章:合理性と知識 · マッチング・マーケットデザイン...
1
2016 年 4 月 14 日(4 月 17 日修正)
第 3 章:合理性と知識 均衡概念:プレーヤーはゲームをどのようにプレイするか? 均衡概念を理解するための三つのポイント
合理的に自身の利益を「最大化」 「知識」を活用して相手プレーヤーの戦略を「合理的に」予想 「経験、慣習」を使って、相手プレーヤーの戦略を「正しく」予想
第3章は最初の2ポイント、合理性と知識、から均衡概念にアプローチ 優位戦略 劣位戦略逐次消去 最適反応 合理化戦略 *第4章にて、経験、慣習の観点からも均衡概念にアプローチ!
ナッシュ均衡
2
3.1. 優位戦略(Dominant Strategy), 劣位戦略(Dominated Strategy)
例:囚人のジレンマ
c d c 1 1 -1 2 d 2 -1 0 0
相手の選択に関係なく d がベスト 相手がcの時 2 1 dを選択した方が得 相手が d の時 0 1 dを選択した方がやはり得
3
優位戦略(Dominant Strategy)の定義 任意の標準形ゲーム ( , , )N S u において、プレーヤー i N の戦略 i is S は、以下の条件
をみたす時、弱い意味で優位戦略(Weakly Dominant Strategy)である: For every \ { }i i is S s ,
( , ) ( , )i i i i i iu s s u s s for all \{ }( )i j j N i is s S . あるいは、優位戦略(Dominant Strategy)である:
For every \ { }i i is S s ,
( , ) ( , )i i i i i iu s s u s s for all \{ }( )i j j N i is s S , and
( , ) ( , )i i i i i iu s s u s s for some \{ }( )i j j N i is s S . あるいは、強い意味で優位戦略(Strictly Dominant Strategy)である:
For every \ { }i i is S s ,
( , ) ( , )i i i i i iu s s u s s for all \{ }( )i j j N i is s S .
[相手の戦略に無関係に常に is がベスト] ⇔ [プレーヤー iにとって is は優位戦略]
4
劣位戦略(Dominated Strategy)の定義 (純粋戦略ヴァージョン:第 5 章にて混合戦略ヴァージョン説明) 標準形ゲーム ( , , )N S u において、プレーヤー i N の戦略 i is S は、以下の条件をみた
す時、(強い意味で)劣位戦略(Strictly Dominated Strategy)である:
There exists another strategy for player i , \ { }i i is S s , such that
( , ) ( , )i i i i i iu s s u s s for all i is S .
あるいは、(弱い意味で)劣位戦略(Weakly Dominated Strategy)である:
There exists another strategy for player i , \ { }i i is S s , such that
( , ) ( , )i i i i i iu s s u s s for all i is S , and
( , ) ( , )i i i i i iu s s u s s for some i is S .
[別の戦略 isの方が is よりも、相手の戦略に無関係に、常に得である]
⇕ [プレーヤー iにとって is は劣位戦略]
5
非劣位戦略(Undominated Strategy):劣位でない戦略(弱い意味、強い意味)
優位戦略は必ず非劣位である。しかし逆は必ずしも真ならず 強い意味での優位戦略が存在するならば、それ以外の戦略はみな
強い意味で劣位戦略 優位戦略が存在するならば、それ以外の戦略はみな
弱い意味で劣位戦略
6
例:囚人のジレンマ
c d c 1 1 -1 2 d 2 -1 0 0
dは(強い意味で)優位戦略, cは(強い意味で)劣位戦略 よって、戦略プロファイル(d,d)がプレイされる ジレンマ: 戦略プロファイル(c,c)の方が(d,d)よりもパレート優位 (1,1) (0,0)
例: 隣の親父と騒音バトル(ワグナーvs 演歌) 囚人のジレンマによるモデル化:c小音量、d 大音量 実際には、互いに協調して(c,c)が実現されるかもしれない この場合、囚人のジレンマは不適切なモデル どのように協調するのか?
cやd 以外に協調のための行動や戦略があるのか?
7
ある戦略が優位戦略ならば、合理的プレーヤーはそれをプレイする。 この際、プレーヤーは「相手がどの戦略をプレイするか」について予想を立てなくていいし、 相手の利得関数についての知識を使わなくてもいい。 ある戦略が劣位戦略なら合理的プレーヤーはそれをプレイしない。 「相手がどの戦略をプレイするか」について予想を立てなくても、相手の利得関数についての知識を 使わなくても、合理的プレーヤーは劣位戦略を排除できる。 優位戦略や劣位戦略はどの標準形ゲームにも存在するわけではない 以下のゲームには優位戦略も劣位戦略もない。(すべて非劣位戦略。要チェック) Matching Pennies
L R L 1 -1 -1 1 R -1 1 1 -1
グーチョキパー グー チョキ パー
グー 0 0 1 -1 -1 1 チョキ -1 1 0 0 1 -1 パー 1 -1 -1 1 0 0
Coordination Game L R
L 1 1 0 0 R 0 0 1 1
8
3.2. 優位戦略が存在する例
3.2.1. 公共財自発的供給(囚人のジレンマ)
供給する しない 供給する 2-C 2-C 1-C 1 しない 1 1-C 0 0
公共財の供給コスト C 公共財1単位の便益 1 (相手にも便益1)
1C の時 「供給しない」が優位戦略 さらに 2 1C ならば 「ふたりとも供給する」がパレート最適。 しかし達成されない
9
3.2.2. せり上げ入札(あるいは二位価格入札)
{1,2}N [0, )iS
1 2( ) 10000u s s and 2 ( ) 0u s if 1 2s s
1( ) 0u s and 2 1( ) 8000u s s if 1 2s s
1 21( ) (10000 )2u s s and 2 1
1( ) (8000 )2u s s if 1 2s s
「財に対する評価(入札者1は1000円、入札者2は8000円)を「正直に」指値する
(その額までせり上げに応じる)」が優位戦略になる! 証明:入札者1について考えよう。(入札者2については同様。) ・入札者2の指値 2s が10000円以上としよう。 指し値 1s を 2s 以上にすると、勝者になり(なることがあり)、自身の真の財評価以上の 2s 円を払うことに
なり、非正の利得 110000 0s である。指し値 1s を 2s 未満にすれば、競りに負けて、利得ゼロになる。
正直に指値( 1 10000s )すれば、利得ゼロであるから、ベストである。 ・入札者2の指値 2s が10000より低いとしよう。 指し値 1s を 2s 以上にすると、勝者になり、自身の真の財評価より低い 2s 円を払うことになり、正の利得
110000 0s である。指し値 1s を 2s 未満にすれば、競りに負けて、利得ゼロになる。正直に指値
( 1 10000s )すれば、正の利得 110000 0s であるから、ベストである。 Q.E.D.
10
3.2.2. マッチング・マーケットデザイン 病院と研修医のマッチング問題:
Gale-Shapley (Differed Acceptance) Algorism:DA アルゴリズム 全病院は「好きな研修医についての順位表」を提出 ex. (1,3,4,2) 各研修医も「好きな病院についての順位表」を提出 ex. (B,C,A,D) 研修医は、1、2、3、4の順に、一番好きな病院を指名し、「暫定マッチ」をきめ ていく 指名された病院は、既に暫定マッチしている研修医より好みなら、既存の暫定マッチ を解約して、指名した研修医と新たに暫定マッチを組みなおす。 もはや暫定マッチが新たにきまったり、組みなおしたりする余地がなくなった時点で マッチング終了
病院 A 病院 B 病院 D病院 C
研修医1 研修医2 研修医3 研修医4
11
数値例
マッチング終了!パレート最適達成
病院 A4 3 2 1
病院 B 1 2 3 4
病院 D4 1 2 3
病院 C 2 4 3 1
研修医1 A B C D
研修医2 B D A C
研修医3 D B C A
研修医4 A C D B
病院 A4 3 2 1
病院 B 1 2 3 4
病院 D4 1 2 3
病院 C 2 4 3 1
研修医1 A B C D
研修医2B D A C
研修医3 D B C A
研修医4 A C D B
病院 A4 3 2 1
病院 B 1 2 3 4
病院 D4 1 2 3
病院 C 2 4 3 1
研修医1 A B C D
研修医2 B D A C
研修医3 D B C A
研修医4 A C D B
病院 A4 3 2 1
病院 B 1 2 3 4
病院 D4 1 2 3
病院 C 2 4 3 1
研修医1 A B C D
研修医2B D A C
研修医3 D B C A
研修医4 A C D B
病院 A4 3 2 1
病院 B 1 2 3 4
病院 D4 1 2 3
病院 C 2 4 3 1
研修医1 A B C D
研修医2 B D A C
研修医3 D B C A
研修医4 A C D B
12
問:各研修医に順位表を自己申告させる際にうそをつくことができるとする。しかし、DAアルゴリズムのもとでは、正直に順位表を申告することが優位戦略になる。このことを確か
めよ。 *DA アルゴリズムは「進振り」にも使えそう(学部 VS 学生)。東大で検討中。
13
3.2.3. 検索連動型広告(スポンサードサーチ)オークション グーグル台頭時期の収入源はほぼすべてこの広告収入!
14
検索結果画面ごとに複数の広告バナー(ポジション):優劣あり 「オークション」によって広告バナーを広告主に割り当てている
ネットユーザーが広告バナーをクリックするたびに、広告主は検索エンジンにお金を払う 金額を指値して、以下のような封印入札が行われる 1番高い指値の広告主が1番いい(一番クリックされやすい)広告バナーを獲得 2番目が2番目にいいバナーを獲得 各ワードごとにオークション 膨大なワード、膨大なユーザー:膨大な広告収入 スポンサードサーチオークションにおいて、広告主が支払う金額をどのように設定するかは、
入札参加者の行動に大きな影響を与える
15
問(スポンサードサーチ・オークション) 検索エンジン G○○GLE が、あるキーワードの検索画面上に広告バナー(枠)を2つ用意したところ、
3つの企業が広告枠獲得の意思を示した。2つのうち上側の広告枠の方がクリックされやすく、広告枠
1,2k が一定期間にクリックされる回数の期待値は企業によらずkb (
1 2b b )とする。企業
1,2,3i にとって1クリック当 0i の価値がある。したがって広告枠 1,2k のもつ期待価値は
kib である。各企業は高々1枠しか需要しない。
このとき次のようなルールのオークションに従って広告枠の割り当てと支払額を決める。各企業に1
クリックあたり何円払えるかを指値してもらう。この指値を [0, )is と表す。一番高い指値をした企業
に広告枠1を、二番目に高い指値をした企業に広告枠2を、割り当てる。(同じ金額を指値した場合、公
正なくじによって順位を決定する。) 支払額は、一番高い指値をした企業は
2位の指値× 1 2b b +3位の指値×2b 」
二番目に高い指値をした企業は 「3位の指値×
2b 」 最下位の企業は 0、と定める。 (1)標準形ゲームで表現せよ。 (2)正直な表明 i is が(弱い意味で)優位戦略であることを示せ。
16
宿題2: 問1:3.2.2.(マッチングマーケットデザイン)の問を解答せよ。 問2:3.2.3.(スポンサードサーチ)の問を解答せよ。