第 2 章 策略型博弈

33
第2第 第第第第第 •第第第第第 •第第 : 艺艺艺艺艺艺艺艺艺 •第第第第第 •第第第第第 第第第第第第第第

description

第 2 章 策略型博弈. 策略型博弈 案例 : 艺术品拍卖的策略型 占优策略解 案例研究续:拍卖中的占优策略. 策略型博弈. 博弈的策略型由三项内容所确定:  1. 博弈中局中人的名单 . 2. 每个局中人可使用的策略集 . 3. 与任何策略组合(每个局中人一个策略)相对应的盈利. 盈利是冯  诺依曼 - 摩根斯坦效用。最简单的博弈类型是两个局中人有两个策略的博弈。 策略型 : 局中人 2 北南 局中人 1 高 π 1 , π 2 π 1 , π 2 - PowerPoint PPT Presentation

Transcript of 第 2 章 策略型博弈

Page 1: 第 2 章  策略型博弈

第 2章 策略型博弈•策略型博弈

•案例 : 艺术品拍卖的策略型

•占优策略解

•案例研究续:拍卖中的占优策略

Page 2: 第 2 章  策略型博弈

策略型博弈

博弈的策略型由三项内容所确定:

1.  博弈中局中人的名单 .

2.  每个局中人可使用的策略集 .

3. 与任何策略组合(每个局中人一个策略)相对应的盈利 .

Page 3: 第 2 章  策略型博弈

盈利是冯诺依曼 - 摩根斯坦效用。最简单的博弈类型是两个局中人有两个策略的博弈。

策略型 : 局中人 2 北 南

局中人 1 高 π1 , π2 π1 , π2

( 高 , 北 ), ( 高 , 北 )( 高 , 南 ),( 高 , 南 )

低 π1 , π2 π1 , π2

( 高 , 北 ), ( 高 , 北 )( 高 , 南 ), ( 高 , 南 )

Page 4: 第 2 章  策略型博弈

当局中人多于两个,以及每个局中人有两个以上的策略时,对策略型的三个分量使用下述符号:

局中人将标记为 1 , 2 ,…, N 。一个局中人代表将表示为第 i

个局中人。

局中人 i 的策略通常表示为 si ,一个特定的策略表示 si* 或 si

# 。除

了局中人 i 以外的所有其它局中人的策略选择记为 s-i 。

πi 将表示局中人 i 的盈利 ( 或冯诺依曼 - 摩根斯坦效用 ) 函数。

对于策略组合, s1* , s2

* ,…, sN* ,其中每一个局中人相应

于一个策略,局中人 i 的盈利将表示为 πi (s1* , s2

* ,…, sN*) 。

Page 5: 第 2 章  策略型博弈

囚徒困境 ( c = 认罪, nc = 拒绝认罪) 卡尔文\克雷 c nc

c 0, 0 7, -2

cn -2, 7 5, 5

性别争端( F = 足球, O = 歌剧)

丈夫\妻子 F O

F 3, 1 0, 0

O 0, 0 1, 3

Page 6: 第 2 章  策略型博弈

抛硬币打赌( Matching pennies )( h = 正面 , t = 反面 )

局中人 1 \局中人 2 正面 反面 正面 1 , -1 -1 , 1

反面 -1 , 1 1 , -1

鹰 - 鸽(或懦夫博弈)( t = 强硬 , c = 退让)

局中人 1 \局中人 2 t c

t -1, -1 10, 0

c 0, 10 5, 5

Page 7: 第 2 章  策略型博弈

投票 对每一个投票者,在这个博弈中的策略有三个部分:在

第一轮中如何投票和第二轮中如何投票,而在第二轮中的投票本身有两个分量。第一个分量是,如果议案A 在第一阶段通过后在第二轮中投票人如何投票,第二分量是,如果(在第一轮中)议案 B 通过后,该投票人又将如何投票。特别地,每个投票人有下述 8个策略可供选择 * 。

AAN; AAB; ANB; ANN;

BAN; BAB; BNB; BNN;

* 当然,投票人知道她在第一轮中自己是怎样投票的。原则上,她的策略也可以根据这个信息。目前我们将略去这种复杂性,因为这样的话,每一个策略中分量的个数将增加到 5—— 替代原来的 3 。(为什么?)

Page 8: 第 2 章  策略型博弈

与展开型的等价性 两种表示博弈的方式是等价的:每一个展开

型博弈可以写成策略型且反之亦然。

Page 9: 第 2 章  策略型博弈

案例:艺术品拍卖的策略型• 艺术品拍卖:描述 假如我们被带入位于纽约洛克菲勒中心的索士比派克伯尼特的

大型拍卖场之一。拍卖商站在房间前面的讲台上。她的旁边有一对随从举着待拍卖物件的影像。设想待拍卖的物件是雷诺伊( Renoir, 1841—1919 )的一组绘画;你很想拥有标号为“ #

264” 的那件可爱的咖啡吧景色。你必须开始做如下的事。

注册:如果你打算投标,必须在商品展销室的入口处注册。那里你将得到一块写有编号的拍卖牌。(为了注册,恐怕你需要一张信用卡。 )

出价程序:一旦轮到标号 #264 ,“你出价所必须做的就是举起你的拍卖牌并等待拍卖商理会你,你不必叫出你出价的数——通常由拍卖商以 10% 的增量自动确定高一些的出价。你不必坐的毕恭毕敬;抓耳挠腮不能算作为一个出价(除非你与拍卖商事先就做了安排)。如果没有人超过你的出价,就是说,没有其他的拍卖牌举起,那么拍卖商敲下小木槌以结束拍卖。”

Page 10: 第 2 章  策略型博弈

艺术品拍卖:策略型

•局中人:注册的那些人

•策略:考虑局中人策略的一个简单方法是认定局中人愿意举牌的最高价。

•结局:最后一个举牌的拍卖者赢得雷诺依作品(抓耳挠腮者不能得到)。

•盈利:赢者将付多少钱?

Page 11: 第 2 章  策略型博弈

占优策略解 定义 . 如果不管其他局中人选择什么样的策略,局中人 i 的策略 si 的盈利严格地大于他的所有其他策略的盈利,换言之,

πi (si, s-i) >πi (si, s-i)

对一切 si 和 s-i 成立

其中 s-i 是除了局中人 i 以外的其他局中人选择的策略向量。那么我们称策略 si强优于局中人 i 的所有其他策略 .

Page 12: 第 2 章  策略型博弈

考虑局中人 1 ,我们称该局中人的策略 b——

记作 s1b—— 优于其他策略—— s1

a ,意指针对局中人 2 的两个策略来说, s1

b 比 s1a 更好

一些;于是π1(s1

b , s2a) >π1(s1

b, s2a)

π1(s1b , s2

b) >π1(s1a , s2

b)  

第一个不等式指出了,如果局中人 2采用了他的第一个策略,那么 s1

b 比 s1a 产生较高一些

的盈利;第二个不等式指出了即使局中人 2

选择他的第二个策略,同样的事实也成立。

Page 13: 第 2 章  策略型博弈

定义 . 如果局中人 i 的策略 si ,对于其他局中人的每一个策略来说,至少与他的另一个策略 s#

i 一样地好,而对于其他局中人的某个策略来说, si严格地好于 s#

i ,即

则称策略 si (弱)优于策略 s#i 。

在这种情况,我们称 s#i 为劣策略。如果 si弱占优

于其他任何一个策略 si ,那么 si 被称为弱占优策略* 。 * 同样的定义应用于强优。如果公式 3.1 中令 si =si

# ,称策略 si

强优于策略。于是策略 si#称作强劣的。

iiiiiii

iiiiiii

sssss

sssss

ˆ)ˆ,()ˆ,'(

),(),'(#

#

对某些

对所有

Page 14: 第 2 章  策略型博弈

占优策略解当每一个局中人都有占优策略时,博弈就有一个占优策略解。

一个策略的组合,如果每一个局中人的策略都是占优策略,那称这个策略的组合为占优策略解。

例如,囚徒困境中(认罪,认罪)构成了一个占优策略解。

左 右

顶 7, 3 5, 3

底 7, 0 3, -1

Page 15: 第 2 章  策略型博弈

案例研究续:拍卖中的占优策略 竞拍人以她对雷诺依作品的真实估价作为她的最高叫价的策略是

一个占优策略。不管其他竞拍人怎样叫价,你所能做得最好的办法是,以你认为画所值的价格作为叫价来。从不同的方式讲,如果你认为画值 3000美元,你最好的办法是闭上你的眼睛,举着你的拍卖牌直到听到拍卖商宣布的叫价高于 3000美元为止

为什么它是个占优策略,与其他几个策略作比较。假使你决定“节省你的出价”,并且在 2500美元处放下拍卖牌。有两种可能的情况。一种情况是,还有某些人最高叫价超过 3000美元,其次,若最高叫价——即赢得雷诺依作品的叫价——是 2700美元。现在,你感觉自己象个傻瓜!你失去了一幅估价为3000美元的画,而你用(稍高于 2700美元)就可以拥有它。3000美元的最高叫价比起 2500美元的叫价来决不会差些——而有时候严格地更好一些。

Page 16: 第 2 章  策略型博弈

总 结 1.策略型博弈由局中人的名单,每个局中人可使用的策略,和关于任何策略组合(一个策略对应于一个局中人)的盈利来描述。 2.每当博弈中有两个局中人,策略型可以很方便地表达为盈利矩阵。对于更多的局中人情况,符号表示式更方便一些。 3.每一个展开型博弈可以表示成策略型。每一个策略型博弈至少有一种展开型表示。4.不管其他局中人如何做,占优策略比其他每一个策略给出较高的盈利。 5.当每一个局中人都有占优策略时,博弈存在占优策略解。 6.艺术品拍卖可以建模为策略型博弈,真实地叫价是该博弈的占优策略解。

Page 17: 第 2 章  策略型博弈

第三章 占优可解性 概念

1. 劣与非劣策略

2. 累次剔除劣策略

案例研究:选举联合国秘书长

更正式的定义

讨论

Page 18: 第 2 章  策略型博弈

概念1. 劣与非劣策略

定义。 策略 s#i 劣于另一个策略 s-i ,如果对于其他

局中人的每一个策略,后者与 s#i 至少一样好,

而对于其他局中人的某些策略, si严格地好于 s#

i ,以致

如果一个策略不劣于任何其他策略,则称它为非劣策略。将劣策略认为“坏”策略,而将非劣策略认为“好”策略

iiiiiii

iiiiiii

sssss

sssss

ˆ),ˆ,()ˆ,(

),,(),(#

#

对所有

对所有

Page 19: 第 2 章  策略型博弈

2. 累次剔除劣策略 局中人 1

局中人 2 左 (L) 右 (R)

上 (U) 1, 1 0, 1

中 (M) 0, 2 1, 0

下 (D) 0, -1 0, 0

3 . 更多例题

Page 20: 第 2 章  策略型博弈

例 1 : 伯川德(价格)竞争 假设双寡垄断市场中的两个公司都可以开出三

个价格中的任一个——高,中或低。进一步假设不管哪个公司开价较低的话就可以得到整个市场。

如果两个公司开价相同,他们将平分市场。这些假设——和任何的价格对——转换成两个公司的收益水平。

例如,对于公司 1 ,只有当它的价格不高于公司 2 的价格,才能有所收益。

Page 21: 第 2 章  策略型博弈

假定收益由如下盈利矩阵给出公司 1 \公司 2 高 中 低

高 6 , 6 0 , 10 0 , 8

中 10 , 0 5 , 5 0 , 8

低 8 , 0 8 , 0 4 , 4

剔除“高”策略后,留给我们如下盈利矩阵

公司 1 \公司 2 中 低

中 5 , 5 0 , 8

低 8 , 0 , 4 , 4

Page 22: 第 2 章  策略型博弈

例 3 :投票博弈 投票博弈:采用多数规则,三个投票人挑

选两个议案 A 或 B 中的一个。通过了第Ⅰ轮的方案再面临与维持原状 N (“都不”)进行决赛。三个投票人的真实偏爱如下:

投票人 1 :

投票人 2 :

投票人 3 :

BNA

NAB BAN

Page 23: 第 2 章  策略型博弈

每一个策略有三个分量:策略 A (后面跟) AN 是指“投 A 的票而反对 B ,然后在第Ⅱ轮中投 A 的票(反对 N ),或投 N 的票(反对 B )。”至于盈利,让我们使用约定,如果他最愿意的方案通过,则获盈利 1 ,第二喜欢的通过,盈利为 0 ,如果第三喜欢(即,最不喜欢)方案通过,则他的盈利为 -1 。

在第Ⅱ轮中真实地投票优于非真实性投票;于是,对投票人 1 来说, AAN 优于 ANN, ANB ,和 AAB 。类似地, BBN 优于 BNN, BNB, 和 BAB 。由同样的逻辑推理,对于局中人 2 ,作为第Ⅱ轮中的投票策略,AB 优于 NB, NN, 和 AN ;对局中人3,第Ⅱ轮的投票策略 NN 优于其他策略。可以看到如果投票人在第Ⅱ轮中真实地投票,那么在那个阶段, A击败 N ,而B输给 N 。

Page 24: 第 2 章  策略型博弈

剔除了(第Ⅱ轮非真实的)劣策略后,策略型如下 投票人3采用 ANN

投票人1\投票人2 AAB BAB

AAN 1, 0, 0 1, 0, 0

BAN 1, 0, 0 0, -1, 1

投票人3采用 BNN

投票人1\投票人2 AAB BAB

AAN 1, 0, 0 1, -1, 1

BAN 0, -1, 1 0, -1, 1

现在看到,对局中人1, AAN 优于 BAN ,对局中人2 AAB 优于 BAB ,而对局中人3, BNN 优于 ANN 。从而,我们得到了 IEDS结局为:投票人1取 AAN ,投票人2取 AAB ,投票人3取 BNN , A (以2票)赢得第Ⅰ轮,而在决赛中继续击败 N 。

Page 25: 第 2 章  策略型博弈

案例研究:选举联合国秘书长 考虑有两个投票人的选举——假如为美国与非洲。

投票人 1——美国——首先投票并着手否决三个候选人 A (安南), B (加利),和 H (布鲁特莱特)中的一个。然后,投票人 2——非洲——否决两个余下的候选人中的一位。假如美国和非洲关于三个候选人的中意顺序如下:

美国:

非洲:BAH HAB

Page 26: 第 2 章  策略型博弈

非洲 HAA HHA HAB HHB BAA BHA BAB BHB

美国 A -1, 1 -1, 1 -1, 1 -1, 1 1, -1 1, -1 1, -1 1, -1

B 1, -1 0, 0 1, -1 0, 0 1, -1 0, 0 1, -1 0, 0

H -1, 1 -1, 1 0, 0 0, 0 -1, 1 -1, 1 0, 0 0, 0

在一轮剔除之后,实际上的博弈成为:美国\非洲HHA

A -1, 1

B 0, 0

H -1, 1

Page 27: 第 2 章  策略型博弈

占优可解性的更正式的定义 考虑有 N 个局中人的策略型博弈;局中人 i 的策略用 si

来表示;令 Si 表示局中人 i 的策略集。在第Ⅰ轮,局中人 i 的劣策略集表示为 Di(I) ,换言之, Di(I) = siSi: si 是劣策略

理性的局中人不会采用劣策略。就是说,不启用 Di(I) 中的策略,这对 i = 1, 2, …, N均成立。

进入第Ⅱ轮,局中人 i 可以在留给自己的策略集 Si Di

(I) 中作进一步的决定,看看它们当中是否又有哪些现在成为劣策略了。一个策略 si

# 现在成为劣的,是指:假定每一个其他局中人也都在第Ⅰ轮中剔除了劣策略之后,在 Si Di(I) 中存在另外一个,它始终至少与 si

#

一样地好,而在某些时候严格地好于 si# 。

Page 28: 第 2 章  策略型博弈

于是,

其中, S-i D-i(I) 是除了局中人 i 以外的所有局中人的非劣策略组合的集合 [1] 。记局中人 i 在第Ⅰ轮中或者在第Ⅱ轮中为劣的所有策略的全体为 Di (Ⅱ) 。一旦知道了没有一个局中人会采用属于 Di (Ⅱ) 中的策略,继续剔除任何这样的步骤,现在又成为劣的那些策略。通过这种做法,又建立了一个在前三轮中为劣策略的集合;称这个集合为 Di (Ⅲ) 。如此等等。

[1] 尤其 S-i – D-i(I)包含了策略向量( s1, …, si – 1, si + 1, …,

sN ),其中每一个策略 sj都是非劣的。

iii

iiiiii sIDSssss

中所有的对 )(),(),( #

iii

iiiiii sIDSssss

ˆ)()ˆ,()ˆ,( # 中某些的对

Page 29: 第 2 章  策略型博弈

假如我们最终达到这样一个状态,剩给每一个局中人的只有一个策略,即,假定经过 T 轮剔除之后,剩下的集合 Si Di

(T) ,恰好包含了一个策略,并且这一事实对 i = 1, 2,…, N都成立。在那种情况,这些每个人剩下的单一策略构成的向量称为累次剔除劣策略( IEDS )的结局,该博弈则称为占优可解的。假如这样的情况不发生——如果在某一轮,对某些局中人,尽管仍然留下多个策略,但是没有更多的策略可以被剔除——博弈就称为没有 IEDS 解。

Page 30: 第 2 章  策略型博弈

没有人会采用劣策略是合理的假设。没有局中人会采用,那些一旦其他的劣策略被剔除之后成为了劣策略的策略,这件事看来也是合理的。没有一个局中人会采用只是在 15轮剔除劣策略之后才转变成的劣策略,这件事似乎就不太合理。这是因为它假定,每个人都同意在连续( 14次)高次数地剔除行动中所有的人都是理性的。如果其他局中人某一次理性的“失误”可能代价昂贵的话,这尤其成问题。考虑下述博弈:

1 \ 2 左 中心 右顶 4 , 5 1 , 6 5 , 6

中间 3 , 5 2 , 5 5 , 4

底 2 , 5 2 , 0 7 , 0

理性的层次

Page 31: 第 2 章  策略型博弈

剔除的顺序(和非唯一的结局)当策略是劣的但不是强劣的,剔除的顺序就要紧了。考虑下面的博弈。

1 \ 2 左 右

顶 0 , 0 0 , 1

底 1 , 0 0 , 0

Page 32: 第 2 章  策略型博弈

不存在性。不是所有的博弈都是占优可解的。例如,在性别争端、扔硬币打赌和布鲁特上校中,不存在劣策略,因而,不存在 IEDS结局。在以下博弈中,每一个局中人都有一个劣策略——“差”——可是在剔除那个策略后留下来的是一个只有非劣策略的 2×2 博弈。

1 \ 2 左 中 差

顶 1 , -1 -1 , 1 0 , -2

中 -1 , 1 1 , -1 0 , -2

差 -2 , 0 -2 , 0 -2 , -2

Page 33: 第 2 章  策略型博弈

总 结

1. 没有一个理性的局中人会采用劣策略,他宁愿采用一个非劣的策略。而且一个理性的局中人不认为他的对手会采用劣策略。

2. 劣策略的剔除可以导致一系列连锁反应,逐步缩小一组局中人采取行动的范围。如果存在一个最终唯一预测,则称它为 IEDS 解。

3.  当在 IEDS 解中包含有许多轮次的剔除时,有理由去关心其预测的合理性。