策略思维-第21章
按键盘上方向键 ← 或 → 可快速上下翻页,按键盘上的 Enter 键可回到本书目录页,按键盘上方向键 ↑ 可回到本页顶部!
————未阅读完?加入书签已便下次继续阅读!
若是换了其他更一般的情况,这个均衡混合的对称性就不会显得如此明显,但仍有一些简单规则可以用来计算。我们以网球比赛为例子说明这些规则。
2 .有人要打网球吗?
网球的首要策略教训之一,就是不到最后一瞬不要选定一个方向。否则,对手可以利用对你的猜测,将球击向另一方。不过,哪怕你看不出对手的移动,预测一下也是大有好处的。假如发球者总是瞄准接球者的反手,接球者就会早有准备,开始向那个方向移动,从而可以更好地将球打回去。因此,发球者应该努力使自己的发球变得不可预测,不让接球者准确预计他的目标。相反,接球者启动的时候不能完全倾向于奔向这一方或者那一方。与手指配对游戏不同,网球选手不应该将不可预测性等同为输赢机会相等。参与者可以通过系统地偏向一边而改善自己的表现,只不过这样做的时候应该确保对方不能预见。
为了具体阐述这个问题,我们设想有这么一对具备特殊技巧的网球选手。接球者的正手稍微强一些。假如他的预计正确,他的正手回球有90%的机会获得成功,而反手回球的成功率只有60%。当然,假如他跑向一方而对方发出的球飞向另一方,那么,回球的质量就会大打折扣:假如他跑向反手一方,而对方发出的球飞向他的正手一方,他能及时转向而成功回球的概率只有30% ;反过来,他的成功率只有20%。我们可以用图7…2 显示上述情况。
发球者一心要使对方回球成功的概率越低越好;接球者的目标恰恰相反。比赛开始前,两位选手要选择自己的作战计划。他们各自的最佳策略是什么?
假如发球者永远瞄准对手的正手,接球者就会预计到球会朝自己的正手而来,从而有90%的概率回球成功。假如发球者永远瞄准对手的反手,接球者也能预计到球会朝自己的反手而来,从而有60%的概率回球成功。
图7…2 接球者成功回球的概率
发球者只有打乱自己的瞄准目标才能降低接球者回球成功的概率。这么一来,他会让接球者永远处于猜测之中,也就没有办法尽享准确预测的优势了。
假设发球者在每次发球前都会在自己的脑子里投掷一枚假想的硬币,根据硬币出现正面或者反面决定自己的发球应该瞄准对手的正手还是反手。现在我们考察接球者若是向正手方移动会出现什么情况。这一猜测准确的概率只有50%。猜测准确的时候,正手回球的成功概率是90% ;而猜测出错的时候,接球者及时转向而成功回球的概率只有20%。因此,他的整体成功概率是1/2*90% +1/2*20%=55 %。通过类似的计算可以知道,若是向反手方移动,他的整体成功概率是1/2*60%+1/2*30%=45%。
在发球者采取50:50 混合策略的前提下,接球者若是从自己的角度出发,就能选出最佳回应策略。他应该向正手方向移动,这么做,成功回球的概率达到55%。而在发球者看来,这个成绩与他永远将球发向一方得到的结果相比已经有所改善。对比一下,假如发球者永远将球发向一方,分别是接球者的正手方和反手方,那么,接球者的成功回球概率分别为90%和60%。
另一个显而易见的问题是,发球者的最佳混合策略是什么?要回答这个间题,我们可将不同的混合策略的结果列成一个图表(如图7 …3所示)。发球者瞄准对方正手方向的概率是一条从O 到100%的水平线。对于所有这些混合策略,图中有两条线,一条显示接球者准备向正手方移动的成功回球概率,另一条则显示他准备向反手方移动的成功回球概率。举个例子:假如接球者准备向正手方移动,概率为0的向正手发球的策略(即100%地向反手发球的策略)就能使接球者的成功回球概率维持在20%的低水平,而100%地向正手发球的策略则会使接球者的成功回球概率达到90%。接球者的成功回球概率从一端直线上升到另一端。
图7…3
两条直线交于一点,在这一点上发球者只有40%的时间将球发向对方正手方。在交点的左边,接球者若是预计对方会将球发向反手方,那么他的成功回球概率就会提高;而在右边,他若是预计对方会将球发向正手方,成功回球概率也会提高。①
① 注意,一旦发球者选择向接球者正手方向发球的概率超过40% (不是50% ) ,接球者如果将赌注押在正手方向,就能取得更好的成绩。哪怕发球者选择向接球者反手方向发球的概率还是较大,但他向两个方向发球的技巧却不相等。
向正手和向反手发球维持在40:60的混合策略,是惟一一个不会让接球者用上述方法占便宜的选择。只有选择这种混合策略,接球者无论选择防守正手还是反手,其成功回球概率都是一样的。两种情况都会留给接球者48%的成功回球概率。发球者若是采取其他任何一种混合策略,只要接球者善加利用,就能使自己的成功回球概率沿着图中的两条直线上升到交点之上,也就是超过48%。因此,40%的时间瞄准对方的正手就是发球者的最佳策略。
混合策略的确切比例是由基本行动配对而成的4种情况确定的。对于拥有不同的绝对优势和相对优势的选手,这里的数字90、60、30 和20会相应发生变化,而他们的最佳混合策略也会随之不同。我们很快就会发现,这样一些变化可能导致一些令人惊讶的结果。这里的关键在于,你必须通过估计你真正参加的博弈的4种基本情况,确定自己的最佳混合策略。
这里有一条捷径,使你不必画出前面提到的图表也可以计算出均衡策略。这个简单的算术方法归功于J。D.威廉斯。'3'回到基本情况的表格。对于发球者,如果选择瞄准对方正手的策略,就要观察对方选择两种不同的回应方式之一会使结果发生什么变化;我们得到90…30=60 。假设他瞄准对方反手发球,再做同样的计算,可得60…20=40 。将上述数字倒过来排列,就能得到最佳混合策略中采用这两种策略的概率。① 因此,发球者应该按照40:60的比例瞄准对方的正手和反手。
现在我们改从接球者的角度考察同一场比赛。图7…4显示了他的不同选择会有什么不同的结果。假如发球者瞄准他的反手,那么,他回
① 我们可以用一点代数知识验证这个结果。假如纵列选手的得失情况如下图所示,左列对右列的均衡比例为(D…B):( A…C)。纵列选手选择左列的概率是p,那么,无论横行选手选择上或者下都没有关系;pA+(1…p)B=pC十1…P)D 意味着p /( 1…p )=(D…B )/(A…C) ,如前所述。由于横行选手的得失是纵列选手的得失的负数,他的均衡混合策略就是上行对下行,即(D…C):(A…B)。
球的时候向反手方移动就能得到60%的成功回球概率,而向正手方移动的成功回球概率只有20%。从O到100%改变向正手方移动的概率,就得到一条和上述两点相交的直线。与前面的分析类似,若是发球者瞄准对手的正手,我们就得到一条从30%上升到90%的直线。这两条直线交于一点,在这一点,接球者向正手方移动的概率为30% ,无论发球者选择瞄准哪一方,他的成功回球概率始终维持在48%。任何其他混合策略都会让发球者占便宜,使他得以选择更好的策略,将接球者的成功回球概率进一步降低到48%以下。
图7…4 接球手向正手移动的概率(% )
此外,我们也可以采用威廉斯的方法。表格显示了接球者两种不同选择可能导致什么不同结果。若向正手方移动,我们得到90…20=70 ; 向反手方移动,我们得到60…30=30。将这两个数字倒过来排列就得到最佳混合策略的比例:30%的时间准备向正手方移动,70%的时间准备向反手方移动。
你可能已经注意到,从两位选手的不同角度计算最佳混合策略,会得到一个有趣的共同点:两次计算会得到同样的成功回球概率,即48%。接球者若采用自己的最佳混合策略,就能将发球者的成功概率拉低到发球者采用自己的最佳混合策略所能达到的成功概率。这并非巧合,而是两个选手的利益严格对立的所有博弈的一个共同点。这个结果称为最小最大定理,由前普林斯顿数学家约翰·冯·诺伊曼(John von Nrumann)与奥斯卡·摩根斯顿(Oscar Morgenstern)创立。这一定理指出,在零和博弈里,参与者的利益严格相反(一人所得等于另一人所失),每个参与者尽量使对手的最大收益最小化,而他的对手则努力使自己的最小收益最大化。他们这样做的时候,会出现一个令人惊讶的结果,即最大收益的最小值(最小最大收益)等于最小收益的最大值(最大最小收益)。双方都没办法改善自己的地位,因此这些策略形成这个博弈的一个均衡。
我们以网球比赛为例,并假设每个选手只有两种策略,以此证明这一定理。假如发球者想努力使接球者的最大成功率最小化,他应该在假设接球者已经正确预计到他的混合策略且会做出最优回应的基础上确定自己的行动。也就是说,接球者的成功率将是图7…5中两条直线的最大值。这个最大值的最小值出现在两条直线的相交处,该点的成功率为48%。
图7…5发球手攻正手的概率(% )
现在我们从接球者的角度考察这个问题:他要努力使自己的最小收益最大化。如图7…6所示,假如接球者一半时间向正手方移动,一半时间向反手方移动,他的新的收益曲线就是原来两条直线的平均值,以点线显示。由于这条直线是向上延伸的,其最小值永远出现在左端,该点的成功率为40%。无论接球者向两方移动的比例是多少,这条直线一定经过成功率为48%的那一点,这是因为发球者可以选择采用40:60的混合策略。假如这条直线出现任何倾斜,那么,它的一端一定落在48%以下。只有在接球者的混合策略为30:70的时候,这条直线才会变成一条水平直线,最小值变成48%。因此,最大值的最小值等于最小值的最大值——48%。
图7…6发球手攻正手的概率(%)
最小——最大定理的普遍证明相当复杂,不过,其结论却很有用,应该记住。假如你想知道的只不过是一个选手之得或者另一个选手之失,你只要计算其中一个选手的最佳混合策略并得出结果就行了。
我们的其他工具,比如威廉斯的方法和上述图表,能够很好地解决一切只有两个选手参加且他们各有两个策略的零和博弈。不幸的是,这些工具并不适用于任何非零和博弈,也不适用于选手数目超过两个或者他们拥有的策略数目超过两个的零和博弈。经济学家和数学家发明了更加普遍的技巧,比如线性规划方法,可以找出最复杂的零和博弈的均衡策略。虽然这些技巧超出了本书的范围,我们还是可以利用其中得出的结果。
所有混合策略的均衡具有一个共同点:每个参与者并不在意自己在均衡点的任何具体策略。一旦有必要采取混合策略,找出你自己的均衡混合策略的途径就在于使别人对他们自己的具体行动无所谓。虽然这听上去像是一种倒退,其实不然,因为它正好符合零和博弈的随机化动机:你想阻止别人利用你的有规则的行为占你的便宜。假如他们确实倾向于采取某一种特别的行动,从你的角度观察,这只能表示他们选择了最糟糕的方针。
说到这里,我们已经解释了采取混合或者随机策略的好处,以及这么做的策略必要性。基本要点在于,运用偶然性防止别人利用你的有规则的行为占你的便宜。将这一原理用于实践则是一个更微妙的间题。下面五个部分可以看做是运用混合策略的迷你指南。
3 .为什么你应该选择正确的混合策略?
假如真能发现某个参与者打算采取一种行动方针,而这种行动方针并非其均衡随机混合策略,另一个参与者就可以利用这一点占他的便宜。在网球比赛的例子中,当发球者采取自己的均衡策略,按照40:60的比例选择攻击对方正手方和反手方时,接球者的成功率为48%。如果发球者采取其他比例,接球者的成功率就会上升。举个例子:假如发球者很傻,决定把所有的球都发向对方较弱的反手方,接球者由于早有预料,其成功率将会增至60%。一般来说,假如接球者认识发球者,确切了解他有什么癖好,他就能相应采取行动。不过,这么做永远存在一种危险,即发球者可能是一个更出色的策略家,好比台球桌旁的骗子,懂得在无关紧要的时候装出只会采用糟糕策略的傻样,引诱对方上当,然后在关键时刻发挥本色,打接球者一个措手不及。一旦接球者以为看穿了对方的惯用手法,而放弃自己的均衡混合策略,一心要占对方便宜,就会上发球者的当。发球者乍看起来很傻的混合策略可能只是一个陷阱。只有采取自己的均衡混合策略才能避免这一危险。
与正确的混合比例一样重要的是随机性的本质。假如发球者向接球者正手方发出4个球,然后转向反手方发出6个球,接着又向正手方发4个球,再向反手方发6个球,如此循环,确实可以达到正确的混合比例。不过,这是一种有规则的行为,接球者很快就能洞察其中奥妙。他可以相应做出正确的移动,成功率因此上升为(4/10)90%+(6/10)60%=72%。发球者若想取得最大效果,必须使每一次发球都不可预测。前面故事里提到的棒球选手戴克斯特拉与史密斯,似乎没意识到这个原则。
4 .为什么不能依赖对手的随机化?
假如一个参与者选择的是他的最佳混合策略,那么,无论对手采取什么样的策略,他的成功率都是一样的。假设你是网球比赛例子里的接球者,而发球者已经选择了他的最佳混合策略,即40:60的混合策略。那么,无论你向正手方还是反手方移动,又或是时而正手方,时而反手方,你的成功回球率都是48%。意识到这一点,你可能打算免掉计算自己的最佳混合策略的麻烦,只随便选定一种行动,并指望对手选择他的最佳混合策略。问题在于,除非你选择自己的最佳混合策略,否则你的对手就没有动机选择他自己的最佳混合策略。举个例子:假如你选择向正手方移动,他会转向攻击你的反手方。为什么你应该选择自己的最佳混合策略?理由就是迫使对方继续使用他的最佳混合策略。
5 .你的技巧变化了,你的最佳混合策略怎样变化?
假设接球者努力改进自己的反手回球技巧,反手方的成功回球率从60%上升为65%。我们可以相应修改用于计算他的最佳混合策略的图表。请看图7…7。我们注意到,接球者向正手方移动的比例从30%上升为33。3% ,而整体成功回球率也从48%上升为50%。
图7…7 接球手向正手移动的概率(% )
随着接球者的技巧不断改进,他的成功率自然也会提高。不过,出人意料的是,这一提高了的成功率是由减少使用改进了的反手技巧取得的。在第1章的妙手传说中,我们说过这样的事情有可能发生;现在我们就来解释一下。
原因在于两位参与者的策略的相互影响。当接球者更善于反手回球,发球者就会多向他的正手方发球(向正手发球的比率达到43%; 而不是原来的40%)。为了适应这个变化,接球者也会多向正手方移动。反手技巧改进了,正手技巧的威力也因此释放出来。好比拉里·伯德的例子,随着他的左手投篮得分率上升,对方防守他的策略不得不发生同样的改变,结果反而给了他更多机会右手投篮。
同样的情况还有一个例子:假设接球者