博弈论复习题(1)

2022-10-09 02:24:39   文档大全网     [ 字体: ] [ 阅读: ]

#文档大全网# 导语】以下是®文档大全网的小编为您整理的《博弈论复习题(1)》,欢迎阅读!
博弈论,复习题
精品文档 知识共享!

1.设一四阶段两博弈方之间的动态博弈如图所示。试找出全部子博弈,讨论该博弈中的可信性问题,求子博弈完美纳什均衡策略组合和博弈的结果。

d24

g85

aBfB

hcAA

b53

e43

36



2.假设一个工会是一个寡头垄断市场中所有企业唯一的劳动力供给者,就像汽车工人联合会对于通用、福特、克莱斯勒等大的汽车厂家。令博弈各方行动的时间顺序如下:1)工会确定单一的工资要求w适用于所有的企业(2)每家企业i了解到w,然后同时分别选择各自的雇佣水平Li3)工会的收益为(w-wαL,其中wα为工会成员到另外的行业谋职可取得的收入,L=L1+Ln为工会在本行业企业的总就业水平;企业i的利润为π(wLi,其中决定企业i利润水


精品文档 知识共享!

平的要素如下。

所有企业都有同样的生产函数:产出等于劳动力qi=Li市场产出为Q=q1++qn时的市场出清价格为pQ=a-Q。为使问题简化,假设企业除了工资支出外没有另外的资本。求出此博弈的子博弈精炼解。在子博弈精炼解中,企业的数量是如何影响工会的效应的?为什么?(吉本斯2.2 2.7答案)



3.下图所示的同时行动博弈重复进行两次,并且第二阶段开始前双方可观测到第一阶段的结果,不考虑贴现因素。变量x大于4因而44)在一次性博弈中并不是一个均衡收益。对什么样的x(双方参与者同时采取)下述战略是一个子博弈完美纳什均衡?

第一阶段选择Qi,如果第一阶段的结果为(Q1,Q2,在第二阶段选择Pi;如果第一阶段的结果为(yQ2,其中yQ1,第二阶段


精品文档 知识共享!

选择Ri;如果第一阶段的结果为(Q1z,其中zQ1,第二阶段选Si;如果第一阶段结果为(yz,其中yQ1,且zQ2,则在第二阶段选Pi

P1 Q1 R1 S1

P2 22 0x 00 0-1

Q2 x0 44 00 0-1

R2 -10 -10 02 -1-1

S2 00 00 00 20

2.10吉本斯)

思路:逐个分析上述的四种情形:

第一种情形,第一阶段选择Qi,第二阶段选择Pi,即双方均采取合作的策略,得益均为6

第二种情形和第三种情形下,实际上有一方是采取了不合作,其得益x,另一方即利益受损方得益为2

第四种情形实际上是双方都不采取合作的策略,而根据题目要求,x,下述战略是一个子博弈精炼纳什均衡,所以x必须小于双方均合作时的收益6,否则第一种情形不会出现,因为既然x>6了,双方均会选择不合作而使情形一不会出现。

由题目先前给定的条件x<4综合之得x的取值为4,6(可参见教68页的分析)

4.两个人A,B分一个冰淇淋。第一阶段A提出分割方案,B可以接受或者拒绝,接受则博弈结束,若拒绝B提出分配方案;同样,A


精品文档 知识共享!

以接受或者拒绝,如果拒绝,就提出自己的分配比例。博弈结束。假定接受的利益和拒绝的利益相同的时候,大家都会选择接受。冰淇淋在每个阶段会化掉1/3(整体的1/3。试分析这个博弈的子博弈完美纳什均衡是什么。





如果每阶段冰淇淋只化掉1/3,采用逆向归纳法。最后一个阶段应该是A在分,如果B绝,两人都是0A的分配不会使B得到的更差,所以为了最大化自己的利益,A便让自己得到1/3B一丁点也得不到。为了防止这一点,在第二阶段B分配的时候,就不会让A分到的比1/3少,否则A会拒绝,B就得不到好处了。B会将剩下的2/3平分,两人各得1/3。深知这一点后,第一阶段在冰淇淋没化的时候A如果让B得到的不少于1/3B就不会拒绝。这样A可以将2/3分给自己,1/3分给B,实现自己利益最大化。此时便达到了纳什均衡

如果每阶段冰淇淋只化掉1/3,采用逆向归纳法。最后一个阶段应该是A在分,如果B绝,两人都是0A的分配不会使B得到的更差,所以为了最大化自己的利益,A便让自己得到1/3B一丁点也得不到。为了防止这一点,在第二阶段B分配的时候,就不会让A分到的比1/3少,否则A会拒绝,B就得不到好处了。B会将剩下的2/3平分,两人各得1/3。深知这一点后,第一阶段在冰淇淋没化的时候A如果让B得到的不少于1/3B就不会拒绝。这样A可以将2/3分给自己,1/3分给B,实现自己利益最大化。此时便达到了纳什均衡


精品文档 知识共享!





5. 1

1paqc2q,企业2的利润函数是2qb2p,其中p

企业1的价格,q是企业2的价格。求: 1)两企业同时决策的纯策略纳什均衡; 2)企业1先决策的子博弈完美纳什均衡; 3)企业2先决策的子博弈完美纳什均衡;

4)是否存在参数abc的特定值或范围,使得两个企业都希望自己先决策(博弈论习题【1P9 习题三)


精品文档 知识共享!






精品文档 知识共享!



6. 试分析为什么在很多商业街上麦当劳与肯德基都是选在商业街的中心段,且比邻而居。(博弈论习题【1P5 最后一句)



假设在一条繁华的商业街有ABCDE五个商业点可以作为开店的位置,每个商业点消费者数量相同,麦当劳和肯德基可以选择ABCDE五个地点中任意一个作为店址。 1)两家店不同时决策。不妨设肯德基先决策,麦当劳再决策(这也符合中国实际情况,中国肯德基数量为麦当劳的3倍,整体发展优于麦当劳,所以一般会先有肯德基),而消费者会选择距离他们最近的店面去消费,若距离一样,则消费者以等概率选择两家店。 基于以上假设就可以对参与人麦当劳(记为M、肯德基(记为K)决策进行分析。K首先进行决策,作为一个理性决策者,K会考虑M的决策。若K选择A,则M会选择B,此时,K只能得到A的顾客,其收益不妨记为1,而M的收益则为4,这显然不是最优策略。若KB,则M会选择C,在这种情况下,K的收益为2M的收益为3。按照这样的思路分析下去,可以得知K选择C是最优策略。此时,无论M选择哪里作为店址,K的收益都不会小于M。之后轮到M进行决策,若选择A,则K的收益为3.5M的收益为1.5,不是最佳应对。以此对每个店址进行分析,可知M选择C是对K选择C的最佳应对。在这种情况下,KM的收益都为2.5两家店平分所有的顾客,两家店的决策也互为最佳应对,达到了纳什均衡。所以,肯德基和麦当劳的店址会选择在同一地点。

2)两家店同时决策。此时两家店的收益矩阵,如下:


精品文档 知识共享!



在这种情况下,直接寻找纳什均衡不是那么容易,但是通过上面的收益矩阵可以看出,对于肯德基,策略A和策略E是严格非优策略,因为在肯德基选择AE的任何场合,它也可以通过选择B来获得一个严格的较高收益。与此类似,对于麦当劳,策略A和策略E也是严格非优策略,因为在任何场合,麦当劳可以选择通过选择B来获得一个严格的较高收益。 理性的参与人不会有任何兴趣去选择采取一个非优策略,因为那总是可以通过一个其他收益更高的策略来替代。因此,肯德基不会选择AE,并且因为麦当劳知道这个博弈的结构,包括肯德基的收益情况,所以麦当劳也知道肯德基不会采取选择AE。因此这两个策略在博弈中会被有效的去除。同样的道理,对于麦当劳也是如此。这是,我们可以得到一个化简后的博弈收益矩阵,这个矩阵只包括BCD三个策略,如下:



这时可以再次发现对于肯德基,策略BD是严格非优策略,对于麦当劳,策略BD也是严格非优策略,化简后对于每个参与人都只有一种策略C,即可得到策略组(CC。当然一种更简单和更方便的方法是直接发现该博弈结构中存在纳什均衡(CC。这表明肯德基和麦当劳同时决策时,最后的结果也会是两家店选址在一起。 综合上面的讨论,可见肯德基和麦当劳总是比邻而开,并不是偶然,而是理性博弈后的必然。

7. 设有一批选民在一个单位区间从左(x=0)到右(x=1)均匀分布,为一个职位参加竞选的每个候选人同时选择其竞选基地(即在x=01之间的一个点)。选民观察候选人的选择,然后每一投票人把票投给其基地离自己最近的候选人。比如,如果有两个候选人,他们分


精品文档 知识共享!

别在x=0.3x=0.6选择基地,则处于x=0.45左边的所有选民都会把票投给候选人1,右边的人都会把票投给候选人2,这样候选人2可以得到55%的选票赢得这场选举。假设候选人只关心他能否当选,他们根本一点都不关心其基地。如果有两个候选人,博弈的纯策略纳什均衡是什么?(吉本斯18



8. 假定古诺的寡头垄断模型中有n个企业,qi代表企业i的产量,Q=q1+……+qn表示市场总产量,p表示市场出清价格,并假设反需求函数由pQ=a-Q给出(设Qa,其他情况下p=0.并设企i生产出的qi的总成本Ciqi=cqi,即没有固定成本,且边际成本为常数c,这里设ca,根据古诺的假定,企业同时就产量进行决策。求出博弈的纳什均衡。n趋向于无穷时,将会发生什么情况? (博弈论习题【1P3 第八题)




精品文档 知识共享!






精品文档 知识共享!

不完全信息博弈

1. 考虑两企业采用伯川德竞争,即静态情况下的价格竞争。两企业间存在着信息不对称,并且产品存在差异。对企业i的需求

qi(pi,pj)apibipj,两企业的成本都为0。企业i的需求对企业

j价格的敏感程度有可能高,也可能较低,也就是说,bi可能等于bH,也可能等于bL,这里bHbL0。对每个企业,bi=bH的概率θbi=bH的概率为1-θ,并且与bj的值无关。每一企业知道自己bi,但不知道对方的,所有这些都是共同知识。此博弈中的行动空间、类型空间、推断以及效用函数各是什么?双方的策略空间各是什么?此博弈对称的纯策略贝叶斯纳什均衡应满足那些条件?求出这样的均衡解。








精品文档 知识共享!

2、试分析下面完全但不完美动态博弈的贝叶斯精炼均衡。

贝叶斯精炼均衡应该满足如下四个条件:

条件 1在各个信息集处,轮到选择的博弈方必须有关于博弈达到该信息集中每个节点的可能性的判断对非单节点信息集,一个判断就是博弈达到该信息集中各个节点可能性的概率分布,对单节点信息集,则可理解为判断达到该节点的概率为1”



条件2:给定轮到选择博弈方的判断,他的后续策略必须是序列理性的。即在给定此判断和其他博弈方后续策略的情况下,该博弈方其后的行为选择意在使自己的期望得益最大。

条件3:在均衡路径上的信息集处,判断要符合贝叶斯法则和各博弈方的均衡策略。

条件4:在非均衡路径上的信息集处,判断也要符合贝叶斯法则和各博弈方在此处可能有的均衡策略。

当一个策略组合及相应的判断满足这四个条件时称为完美贝叶斯均衡



1

F

B

2

L(p)

R(1-p)

(2,0,0)

3

U

D

U

D

(1,2,1)(3,3,3,)(0,1,2)(0,1,1)



第一种解释分析:

上图是一个有三个博弈方的三阶段不完美信息动态博弈。在该博弈中,博弈方3 的信息集是一个两节点信息集。

如果博弈方1第一阶段选F则博弈过程会经历多节点信息集假设博弈方3判断博弈2LR的概率分别是 p1-p,最终共有四种可能的结果,各方得益如图所示。

(1P,选 D 先考察博弈方3的选择,他选 U 的期望得益为: P 1 P ) 2 2

) 1期望得益为 P 3 (1 P 1 2 P 因此当 2 P 1 2 P ,即pl/3 时他该选U

pl/3 时,他该选DP=1/3 时选UD或者混合策略都可以。

先假设博弈方3“判断” p1/3,此时他的合理选择是D;再来看博弈方2的选择,因为L是他相对于R的严格上策,因此他无需考虑博弈方3在第三阶段如何选择,而唯一地只选


精品文档 知识共享!

L。可知,博弈方3“判断”p1/3是符合博弈方2 的均衡策略的。

又,既然博弈方 2只会选L故,完全符合博弈方2均衡策略的博弈方3判断应该p=1

对于博弈方1而言,他知道从博弈方2选择开始的子博弈的均衡必然为(LD,意味着自己选择F可以获得3单位得益,比选 B得益2要好,因此 F是他的均衡策略。均衡策略组合(FLD)以及与之相应的博弈方3判断”p = 1完全符合完美贝叶斯均衡的条13,并且由于在上述策略组合下不存在不在均衡路径上需要判断的信息集,因此条件 4 自动满足,可以肯定这是一个完美贝叶斯均衡。

第二种解说分析:

由于在该博弈中,从博弈方2 的单节点信息集开始的子博弈实际上是一个静态博弈(由于博弈方3对博弈方2的行为具有不完美性,因此相当于他们同时做出行为选择)如下图所示。



显然,该静态博弈有唯一的纳什均衡(LD,故整个博弈有唯一子博弈完美纳什均衡FLD

为了说明条件4的必要性,考察另一个策略组合(BLU)及博弈方3相应的判断 p=0

该策略组合是一个纳什均衡,原因是不论博弈方1 选什么策略,博弈方2的最佳反应对策都是L;而当博弈方3判断 p=0 的情况下,U是他对博弈方2的最佳反应对策;对于博弈方1 来说,当其他两方的策略是(LU)时,当然是选 B 合算,从而(BLU满足相互是对对方策略的最佳反应对策。 其次在博弈方3判断p=0时,BLU)是序列理性的,且在均衡路径(B)上没有多节点信息集,条件3自动满足。即策略组合(BLU)和博弈方3 判断 p=O是满足完美贝叶斯均衡的条件13的。 然而,仅此就断定它是一个完美贝叶斯均衡是有问题的,因为这时各博弈方得益20O)是极不理想的。

此时条件4就可以起作用了。在(BLU)策略组合下,博弈方 3信息集正是不在均衡路径上的信息集,但博弈方3在此处的判断p=0显然与博弈方2的策略L不相符合。因此上述策略组合和判断不能构成完美贝叶斯均衡,这就把(BLU 排除出了完美贝叶斯均衡的范畴,从而使得完美贝叶斯均衡是更加可靠、稳定和合理的均衡概念。

4. 分析下图中的博弈可能存在哪几类均衡?试分析其精炼贝叶斯均衡。


精品文档 知识共享!



13

a1

L

发送者t1

a1

R

21

40

a2

接收者

0.5

自然

接收者

a2

00

24

a1

L

0.5

t2发送者

a1

R

10

01

a2

a2

12

1)自然选择发送者类型,告诉发送者,接受者不知道发送者真是类型,但类型的概率分布(0.50.5)是共同知识。

2)对于假设存在混同均衡(LL,成立的条件是接收者对于发送者发送L的信号的反应是选择a1,对发送R的信号的反应是a2——接收者均衡策略为(a1a2。接收者对信号R的反应是选择a2的条件是:1*q+01-q<0*q+2(1-q),得出q<2/3,所以精炼贝叶斯均衡为(LLa1a1接收者)p=0.5q<2/3

3)对于混同均衡(RR)由贝叶斯法则得(q1-q=(0.50.5),接收者对于信号R的反应是选择a2,类型为t1的发送者支付为0,类型为t2的发送者支付为1,接收者对L的最优反应是a1(无论p为多少),此时t1支付为1t2支付为2RR)不可能称为混同均衡。

3)对于分离均衡(LR,接收者的两个信息集都在均衡路径上,于是pq都由贝叶斯法则与发送者的策略确定p=1q=0 ;给定p=1,接收者对于信号L的反应是选择a1;给定q=0,接收者对于信号R 的最优反应是选择a2t1t2支付均为1,给定接收者的最优战略a1a2t2有积极性偏离R的策略,所以不存在分离均衡(LR

4)对于分离均衡(RL,由贝叶斯法则,得到p=0q=1,给定p=0,接收者对于信号L的反应是选择a1;给定q=1,接收者对于信号R 的最优反应是选择a1t1t2支付均为2给定接收者的最优战略(a1a1t1t2均无积极性偏离(RL),所以[(RL)(a1a1)p=1q=1]为精炼贝叶斯均衡。



5.假设市场上存在着两类工人,以他们的生产率来区分。kH型工人具有生产率为k=2kL型工人的生产率为k=1要达到给定的教育水平,花在kL型工人身上的成本要大于花在kH型工人身上的成本。特别地,对于k型工人,每e个单位的教育成本为c(ek)=e/k。对一


精品文档 知识共享!

k型个人的效用函数为Uwek=w-cek

a)工人的教育水平影响他的生产率吗?如果公司和工人具有关于k值得相同的信息,什么是最优的教育水平?

现在假设工人的生产率不能被厂商观察到,但他的教育水平能被厂商观察到。进一步假设,厂商相信大于或等于某一特定水平ep教育水平是高生产率的信号,而低于这一教育水平的则是低生产率的信号。因此厂商提供工资的根据是:如果eep,则we=2,而如果eep,则w(e)=1

b)给定这些工资,计算每一类代理人会选择的教育水平。 c)找出有关ep的必要条件,使得教育是一个有效传递生产率的信号。

d)证明,由(c)得出的ep值,与厂商在均衡处的信念是一致的。 e)讨论得出的结果






精品文档 知识共享!





6. 两个合伙人必须就其合伙企业进行清算。合伙人1现在拥有权益份额为s,合伙人2拥有1-s。两合伙人同意进行如下博弈:合伙人1提出一个价格p,然后合伙人2可以选择以ps的价格购买合伙人1


精品文档 知识共享!

的股份,或以p1-s)的价格将自己的股份卖给合伙人1.假设两个合伙人对拥有全部企业价值的估价相互独立,且服从〔0,1〕区间的均匀分布,以上是共同知识,但每一个合伙人的估价是私人信息。求出博弈的精炼贝叶斯均衡。

解:设合伙人12对拥有全部企业价值的估价分别为v1v2,收益函数分别为U1U2,由题目条件可以得出,

U1=ps-v1s 当合伙人2向合伙人1购买; U1=v1s-p(1-s) 当合伙人1向合伙人2购买。



U2=ps-v1s 当合伙人2向合伙人1购买; U2=v1s-p(1-s) 当合伙人1向合伙人2购买。

由于两个合伙人对拥有全部企业价值的估价相互独立,且服从0,1区间的均匀分布,由逆向归纳法可以得出该博弈的精炼贝叶斯均衡: ps-v1s>v1s-p(1-s),v2s-ps>p(1-s)-v2s,v1

时,合伙人2向合伙人1购买股份;

反之,当v2< p/(2s)时,合伙人1向合伙人2购买股份。

7. 企业和工会进行下面的两阶段谈判博弈。企业利润π服从o1之间的均匀分布,工会的保留工资为wr,以上都是共同知识,只有企业才了解π的真实值。假定0wr1/2,求出下面博弈的精炼贝叶斯均衡:

a 在第一阶段的开始,工会向企业提出一个工资要价w1


精品文档 知识共享!

b 企业或接受或拒绝w1,如果企业接受w1,则两阶段都可以开工生产,于是工会的收益为2w1,企业的收益为2(π-w1(不考虑贴现因素)。如果企业拒绝w1,则第一期就没有产出,且企业和工会第一阶段的收益都等于0

c 在第二阶段的开始(假定企业拒绝了w1,企业向工会提出一个工资出价w2

d 工会或接受或拒绝这一出价,如果工会接受w2,则第二期会有产出,于是第二期(也是全部)的收益为工会w2,企业为π-w2(第一期收益为0.如果工会拒绝w2,则没有产出,工会在第二期赚得其保留工资w,企业关闭,收益为0.


精品文档 知识共享!

信息经济学习题

1 理有三个可能的行动aa1,a2,a3企业有两个可能的利润水平:



H

10L0

f(Ha1)2,f(Ha2)1f(Ha3)1。假定经理的效用函数为323Uwg(a)其中w是工资收入,g(a1)53,g(a2)85,g(a3)43

经理的保留效用为U=0

1 果经理的选择是可观测的,什么是最优工资合同 2 明:如果经理的选择是不可观测的,那么,没有合同可以使

得经历选择a2。当g(a2)满足什么值时,a2是可以实现的。 3 么是经理的选择不可观测时的最优激励合同

4 g(a1)8,并且f(Ha1)x(0,1)。如果经理的选择是可观

测到的,当x趋向于1时,最优合同是什么?如果经理的选择不可观测到,当x趋向于1时,最优合同又是什么?


精品文档 知识共享!






精品文档 知识共享!







2 察委托人与代理人之间的关系,其中只存在两种可能结果,一


精品文档 知识共享!

种高xH,一种低xL,每种结果发生的频率取决于代理人的努力

e0,1probxxHeeprobxxLe1e

U(w,e)u(w)v(e)

u0,u0;v0,v0。委托人的效用函数为B(xw),是递增的凹

函数。

1 出委托人的有约束的最大化问题,求出决定最优合约的条



2 设代理人的努力不能被观察到,写出在这一情况下定义最

优合约的有约束的最大化问题。描述信息对称情况下与信息不对称情况下最优合约的工资之间的差别。








精品文档 知识共享!

3 察委托人与代理人之间的关系,代理人的努力来决定结果。假

设出现的不确定性可以用三种状态来表示。代理人可以在两种努力水平之间做出选择。结果如下图 努力

e=6 e=4

自然状态

ε1

60000 30000

ε2

60000 60000

ε3

30000 30000

委托人与代理人都相信每种状态的发生概率为三分之一。委托人和代理人的效用函数分别为:B(xw)xwU(w,e)we2中间所有的结果都是以货币支付表示。假设代理人只有在他获得的效用水平至少114时,他才会接受。(请给出问题解答的基本过程) 1 参与人的目标函数中可以得出什么结论?

2 对称信息中,努力和工资为多少?如果委托人不是风险中性

的会怎么样?

3 不对称信息中,委托人得到努力水平e=4所容许的支付方案

如何?获得努力水平e=6所容许的支付方案如何?委托人偏好那种努力水平?请讨论结果 解答

1)委托人是风险中性的,而代理人是风险规避的。

2)最优合约从以下两个条件中得出:一、委托人承担所有的风险,以及二、参与约束成立。如果e=6,那么w满足w½-62=114,其中w=22500。在这一事例中。UP=50000-22500=27500。如果e=4,则


精品文档 知识共享!

w=16900UP=23100.对称信息境况下的解为:e*=6w*=22500。若委托人不是风险中性的,则两个参与者将共同分摊合约关系中涉及的风险。

3)如果e=4,最优合约同上:w=16900,因为给定固定工资,代理人总会选择最低的努力水平。为了达到e-6,委托人必须提供一份状态依存于结果的合约。如果结果是60000,他将支付w(60);如果结果是30000,他将支付w(30)。合约必须同时满足参与约束和激励约束:

1122

[w(60)][w(30)]236114 3

11112121222

[w(60)][w(30)]36[w(30)][w(60)]2163333

对委托人“花费量尽可能最少”问题的解中,两个约束都成立。对于两个未知量我们有两个方程,得解:w(60)=28900以及w(30)=12100委托人的期望效用是UP=26700。在不对称信息的境况下,委托人还是选择e=6,因为26700>23100,但有效率损失,这由委托人期望利润的减少来衡量(代理人总能获得他的保留效用)

4 定一个商人想与一个工人签约,但工人的一些情况商人却不知

道。商人知道这个工人是风险中性的,但是就努力的负效用而论,工人可能是两种类型中的一种。他的负效用或者是e2,或者是2e2即,第二类工人(差的)经受的努力的负效用大于第一类(好此工数取型,


精品文档 知识共享!

UG(w,e)we2UB(w,e)w2e2工人是G型的概率为p两类工

人的保留效用都为0。商人也是风险中性的,他以(e)ke评价工人的努力,其中k是一个足够大的常数,以使监工有兴趣与代理人签约,此常数独立于代理人的类型。因此,对提供的每一单位努力而言,商人获得k单位的利润。

1 果商人对工人的类型拥有完全的信息请列出公式,并求

解商人的问题,即需要的努力水平是多高?支付的工资是多少?

2 向选择问题出现时,列出此问题的表述模型。求解问题并

计算最优合约的特征。

3 较对称信息与不对称信息下的结果,并作分析。


精品文档 知识共享!




本文来源:https://www.wddqxz.cn/92b84dee5bf5f61fb7360b4c2e3f5727a5e9242d.html

相关推荐