弈论模型汇总与整理¶
基础模型¶
一般模型 | 参与人B | ||
L | R | ||
参与人A | U | a,b | c,d |
D | e,f | g,h |
通过控制参数之间大小的不同情况能够决定该博弈的具体类型。
智猪博弈¶
参数大小关系¶
a\<e,c>g,b\<d,f\<h
相关案例:大小股东案例¶
假设大小股东的持股比例分别为70股与30股,每股收益10元。大小股东需要选择是否监督该公司。两人监督成本不同,大股东的监督成本为100元,小股东监督成本与大股东选择有关。
若大小股东都选择监督,则小股东监督的成本为200元(因为小股东的资金和精力有限,他监督经营者的成本会比大股东大);若大股东不监督而小股东选择监督,则小股东需要支付额外的监督成本150元。(实际金额肯定比此处大得多)
均衡情况¶
智猪博弈 | 小股东 | ||
监督 | 不监督 | ||
大股东 | 监督 | 600,100 | 600,300 |
不监督 | 700,-50 | 0,0 |
在小股东看来,不论大股东选择监督或是不监督,小股东的最优方案都是选择不监督。
在大股东看来,若小股东选择监督,那自己应该选择不监督以实现利益的最大化,若小股东选择不监督,自己应该选择监督。
然而根据小股东的分析情况,大股东已经知道小股东会选择不监督了,那么他肯定会选择去监督。
即均衡情况为大股东监督,小股东不监督。
斗鸡博弈¶
参数大小关系¶
a\<e,c>g,b\<d,f>h,且a\<g,b\<h.
相关案例:古巴导弹危机案例¶
1962年,为报复美国在意大利和土耳其部署的针对苏联的核导弹,苏方在古巴境内秘密部署针对美国的核导弹,但这一举动很快被美国发现。一时间美苏双方针锋相对,互相威胁将冷战升级为热战,在 13 天的危机交涉中,双方军队在加勒比海地区险些擦枪走火。最终双方相互妥协,苏联撤走了部署在古巴的导弹,美国保证不会入侵古巴并承诺稍后撤走部署在土耳其的导弹。
均衡情况¶
斗鸡博弈 | 苏联 | ||
强硬 | 妥协 | ||
美国 | 强硬 | -200,-200 | 100,0 |
妥协 | 0,100 | 10,10 |
该博弈有两个均衡结果,分别是美国选择强硬、苏联选择妥协,与美国选择妥协,苏联选择强硬。一进一退中,往往鲁莽、非理性、非理智的形象能在气势上压倒对方以获得胜利,所以双方谁能压倒对方将取决于谁表现出更强的决心。 在边缘博弈中,最重要是要让对方相信自己的恐吓绝不是虚张声势,甚至让对方相信自己的决策是身不由己(例如美国军方的某些行动就没有经过肯尼迪的同意)。由于双方都有强烈的愿望避免双输的局面出现,因此最终的结果往往都是双方达成一致,各自妥协。
囚犯困境¶
参数大小关系¶
a>e,c>g,b>d,f>h且a\<g,b\<h
相关案例:电商案例¶
买家针对不同商品的选择分为买高价和买低价,卖家针对不同商品的选择分为卖高品质货和卖低品质货。
均衡情况¶
囚犯困境 | 卖家 | ||
高品质 | 低品质 | ||
买家 | 高价 | 7,7 | -5,10 |
低价 | 10,-5 | 3,3 |
在这个游戏里,无论卖家如何选择,买家总是出低价更划算;另一方面,无论买家如何选择,卖家总是提供低质商品更划算。然而明明有一个大家都能获得更好的回报的可能性,可是博弈的结局却注定了是一个对双方来说都更差的结果。
性别战¶
参数大小关系¶
a>e,c\<g,b>d,f\<h且c=e,d=f
相关案例¶
假设在一支篮球队里有甲乙两位队员,甲队员擅长控场,而乙队员擅长快攻。每次持有球权后,双方必须在场上进行博弈,如果两人都选择控场,则乙可能不习惯,但最终能帮助队伍得分;同理,如果都选择快攻,则甲可能打得不爽。但如果两人意见不一致,则选择快攻的队员已经大步流星向前的时候,选择控场的队员还在慢悠悠地往前走,这就导致队伍的收益为0。
均衡情况¶
性别战 | 乙 | ||
控场 | 快攻 | ||
甲 | 控场 | 10,5 | 0,0 |
快攻 | 0,0 | 5,10 |
综上所述,该博弈的均衡是(甲控场,乙控场)或(甲快攻,乙快攻)。因此,这就说明了在比赛过程中队长或者主教练的重要性,一定要有一个足够拥有话语权的权威将各个队员的战术统一起来才能使得最终球队获益最大。
监督博弈¶
参数大小关系¶
当参数的关系满足下图且H\<W\<V,W>C-F时,为监督博弈
监督博弈 | 雇员 | ||
偷懒 | 不偷懒 | ||
雇主 | 检查 | -C+F,-F | V-W-C,W-H |
不检查 | -W,W | V-W,W-H |
相关案例¶
园丁养了一盆植株,由于天气变化较快,需要经常去检查植株的生长情况。如果园丁不检查且植株正常生长,则植株的收益G就是园丁的收益,而如果园丁检查且其生长正常,园丁在获益G的基础上还要减去检查成本J;如果园丁不检查且植株不正常生长则植株死亡,双方获益均为0,而如果园丁检查到植株不正常生长就会浇水、施肥等,使植株重新生长获益X。
均衡情况¶
监督博弈 | 植株 | ||
不正常生长 | 正常生长 | ||
园丁 | 检查 | -J+X,X | G-J,G |
不检查 | 0,0 | G,G |
假设园丁检查概率是α,植株不正常生长概率是β,那么对园丁来说,T_(检查)=\(\beta \times (X - J) + (1 - \beta) \times (G - J)\),T_(不检查)=\((1 - \beta) \times G\),均衡时两者相等,解得\(\beta = \frac{J}{X}\)。同理,对于植株,均衡时可解得,\(\alpha = \frac{G}{X}\)。此时园丁的期望收益D_(雇主)=\((1 - \frac{J}{X}) \times G\)。
在不改变种植植株品种的情况下,植株收益G是不变的,所以若园丁希望获得更大的效益,可以采取提高检查效率以降低检查成本J,或是考虑在每次检查后给予植株更精细的保护以提高重新生长收益X。
猎鹿博弈¶
参数大小关系¶
a>g、a>e、b>h、b>d且g>c、h>f
相关案例:卷饼和冰淇淋¶
1904年夏天,在美国举行世界博览会期间,有一个制作糕点的小商贩在会场外面卖薄饼,他的薄饼生意很糟糕,而和他相邻的一个卖冰淇淋的商贩生意却非常好,很快就卖出了很多冰淇淋,把带来的用来装冰淇淋的小碟子用完了。
于是,卖薄饼的的商贩灵机一动,把自己的薄饼卷成锥形,用它来盛放冰淇淋。卖冰淇淋的商贩见这个方法很可行,就要了大量的薄饼,大量的锥形冰淇淋便进入了客商们的手中。而令他们意想不到的是,这种锥形的冰淇淋被客商们看好,而且被评为“世界博览会上真正的明星”。从此,这种锥形冰淇淋开始大行其道,这就是现在的蛋筒冰淇淋。
均衡情况¶
猎鹿博弈 | 卷饼 | ||
一起卖 | 单独卖 | ||
冰淇淋 | 一起卖 | 10,7 | 0,1 |
单独卖 | 3,0 | 3,1 |
如果买卷饼的和卖冰淇淋的双方都选择单独卖,那么双方都有一定的收益。但若双方都选择一起卖,那么可以获得更大的收益。反之,若其中有一方想合作,有一方想单独卖,那么合作达不成,选择合作的人将会一无所获。