博弈论-第3章
按键盘上方向键 ← 或 → 可快速上下翻页,按键盘上的 Enter 键可回到本书目录页,按键盘上方向键 ↑ 可回到本页顶部!
————未阅读完?加入书签已便下次继续阅读!
”。按照他的观点,没有集权的合作是不可能产生的。因此,一个有力的政府是必要的。
曾经有一位人类学家写了一个关于伊克人的故事:伊克人从前是在乌干达北方山谷里采集、打猎的游牧民族,政府决定在那里开辟一个国家公园,于是,他们为法律所迫,不再在山谷间打猎,而成了耕种于山岭薄地的农民。
生活环境和生活方式的变化,摧毁了他们原有的社会规范,伊克人因此把自己变成了一群不可救药的、让人讨厌的人,他们六亲不认、极端自私、毫无爱心。
这些人似乎生活在一起,聚集在密集的小村子里,但他们实际上是孤寂的、互不联系的个人,没有明显的互相利用。他们也说话,但说出的只是些粗暴的强求和冰冷的回绝。他们什么东西都不共享,从来不歌唱。孩子一旦能走路了,就把他们赶出家门去抢劫。只要可能,随时都会把老年人抛弃,让他们饿死。行劫的孩子从无能为力的老人嘴边抢走食物。
他们生儿育女时毫无爱心,甚至连粗疏的照顾都没有。他们在彼此的大门口排便。他们对邻居幸灾乐祸,只是见到别人不幸时他们才笑。他们常常笑,也就是常常有人倒霉。
伊克人因此成为文学上的一个象征,用来代表整个人类失去信心、失去人情味后的命运将是什么。
今天,世界各个国家在没有统一领导(联合国只是个协调机构)的情况下交往。因此,产生合作的必要条件就与国际政治的许多中心问题有关。最重要的就是安全困境:国家往往通过那些威胁到其他国家安全的手段来寻求自身的安全。这个问题体现在区域冲突和军备竞赛上。
在日常生活中,我们会问自己还要请多少次那些从来不回请我们的客人来就餐。一个机构中的管理者为了得到一些回报而给另一位管理者提供帮助。一个得到绝密消息的新闻记者为了得到进一步的消息而对来源保密。如果只有两个公司同时生产一个产品,一个公司定较高的价格是为了期望另一个公司也能保持高价,因为这样,双方都能得到好处(当然消费者吃亏了)。
合作中存在着一个根本问题,两个工业国家之间相互设置贸易壁垒便是一个很好的例子。由于自由贸易能给双方带来好处,因此,如果两个国家消除这些贸易壁垒都能受益。问题是,无论谁单方面采取行动消除自己一方的贸易壁垒,它都会发现自己处于不利于本国经济的贸易状态下。事实上,不论一个国家如何做,另一个国家保持它的贸易壁垒总是比较有利的。因此,每一个国家都有利益动机来保持贸易壁垒,尽管由此带来的结果比双方都合作差得多。
这个根本问题就是:个体对自身利益的追求会损害整体的利益。为进一步了解大量的具有这类性质的情况,需要有一个方法来表示这些情况的共同点,同时避免陷于每个情况的具体细节,即著名的“囚徒困境”游戏。
启示:一只河蚌正张开壳晒太阳,不料,飞来了一只鹬鸟,张嘴去啄它的肉,河蚌急忙合起两张壳,紧紧地钳住鹬鸟的嘴巴。鹬鸟说:“今天不下雨,明天不下雨,就会有死蚌肉。”河蚌说:“今天不放你,明天不放你,就会有死鹬鸟。”谁也不肯松口。有一个渔夫看见了,便走过来把它们一起捉走了——在对手的背后,往往还有更大的、共同的敌人。
“囚徒困境”的故事
1950年,数学家塔克任斯坦福大学客座教授,在给一些心理学家作讲演时,他用两个囚犯的故事,将当时专家们正研究的一类博弈论问题,作了形象化的解释。从此以后类似的博弈问题便有了一个专门名称——“囚徒困境”。
借着这个故事和名称,“囚徒困境”广为人知,在哲学、伦理学、社会学、政治学、经济学乃至生物学等学科中,获得了极为广泛的应用。
所谓的“囚徒困境”,大意是这个样子的。
甲、乙两个人一起携枪准备作案,被警察发现抓了起来。警方怀疑,这两个人可能还犯有其他重罪,但没有证据。于是分别进行审讯,为了分化瓦解对方,警方告诉他们,如果主动坦白,可以减轻处罚;顽抗到底,一旦同伙招供,你就要受到严惩。当然,如果两人都坦白,那么所谓“主动交代”也就不那么值钱了,在这种情况下,两人还是要受到严惩,只不过比一人顽抗到底要轻一些。在这种情形下,两个囚犯都可以作出自己的选择:或者供出他的同伙,即与警察合作,从而背叛他的同伙;或者保持沉默,也就是与他的同伙合作,而不是与警察合作。这样就会出现以下几种情况(为了更清楚地说明问题,我们给每种情况设定具体刑期):
如果两人都不坦白,警察会以非法携带枪支罪而将二人各判刑1年;
如果其中一人招供而另一人不招,坦白者作为证人将不会被起诉,另一人将会被重判15年;
如果两人都招供,则两人都会因罪名各判10年。
这两个囚犯该怎么办呢?是选择互相合作还是互相背叛?从表面上看,他们应该互相合作,保持沉默,因为这样他们俩都能得到最好的结果——只判刑1年。但他们不得不仔细考虑对方可能采取什么选择。问题就这样开始了,甲、乙两个人都十分精明,而且都只关心减少自己的刑期,并不在乎对方被判多少年(人都是有私心的嘛)。
甲会这样推理:假如乙不招,我只要一招供,马上可以获得自由,而不招却要坐牢1年,显然招比不招好;假如乙招了,我若不招,则要坐牢15年,招了只坐10年,显然还是以招认为好。无论乙招与不招,我的最佳选择都是招认。还是招了吧。
自然,乙也同样精明,也会如此推理。
于是两人都作出招供的选择,这对他们个人来说都是最佳的,即最符合他们个体理性的选择。照博弈论的说法,这是本问题的惟一平衡点。只有在这一点上,任何一人单方面改变选择,他只会得到较差的结果。而在别的点,比如两人都拒认的场合,都有一人可以通过单方面改变选择,来减少自己的刑期。
也就是说,对方背叛,你也背叛将会更好些。这意味着,无论对方如何行动,如果你认为对方将合作,你背叛能得到更多;如果你认为对方将背叛,你背叛也能得到更多。你背叛总是好的。这是一个有些让人寒心的结论。
为什么聪明的囚犯,却无法得到最好的结果?两个人都招供,对两个人而言并不是集体最优的选择。无论对哪个人来说,两个人都不招供,要比两个人都招供好得多。
“囚徒困境”这个问题为我们探讨合作是怎样形成的,提供了极为形象的解说方式,产生不良结局的原因是因为囚犯二人都基于自私的角度开始考虑,这最终导致合作没有产生。
在这个游戏中,你将如何做呢?设想你认为对方将合作,你可以选合作,那么你将得到“对双方合作的奖励”。当然,你也可以选背叛,得到“对双方背叛的惩罚”。
换言之,如果你认为对方合作,那么你背叛将能得到更多的好处。反过来,如果你认为对方将背叛,那么你也有两个选择,你选择合作,那么你就是“笨蛋”;你选择背叛,就会得到“对双方背叛的惩罚”。因此,对方背叛,你也背叛将会更好些。这就是说,无论对方如何行动,你背叛总是好的。到现在为止,你似乎知道该怎样做;但是,要知道相同的逻辑对另一个人也同样适用。
因此,另一个人也将背叛而不管你如何做。这样,你们将是双方背叛,只能一起坐牢很久,这比你们双方合作所能得到的“奖励”(只需短期服刑)差很多。个体的理性导致双方得到的比可能得到的少,这就是“困境”。
启示1:在“囚徒困境”中表现最好的策略直接取决于对方采用的策略,特别是取决于这个策略为发展双方合作留出多大的余地。独立于对方所用策略之外的最好决策规则是不存在的。
启示2:“囚徒困境”是一些非常普遍而有趣的情形的简单抽象。在这些情形中,从个人的角度来说,背叛是最好的选择,但双方背叛会导致不甚理想的结果出现。
选1还是选2
这个问题不仅让商人们苦恼不堪,也同样折磨着商学院的学生们。一位教授让自己班上的27名学生进行一个博弈,而这个博弈会把他们带入“囚徒困境”。
假设每一个学生都拥有一家企业,现在他必须决定自己应该1,生产高质量商品来帮助维持较高价格,还是2,生产假货来通过别人所失换取自己所得。根据愿意选择1的学生总数,将收入分给每个学生。
这是一个“事先设计好”的博弈,目的是确保每个选择2的学生总比选择1的学生多得50美分,这个设定当然有现实意义,生产假货成本要比高质量商品低。不过,选择2的人越多,他们的总收益就会越少,这个假设也有道理:假货太多,就会使市场混乱,产品信誉降低。
假设全体27名学生一开始都打算选择1,那么他们各得1。08美元。假设有一个人打算偷偷改变决定,选择2,那么,选择1的学生就有26名,各得1。04美元比原来少了4美分,但那个改变主意的学生就能得到1。54美元比原来多了46美分。
实际上,不管最初选择1的学生总数是多少,结果都是一样,选择2是一个优势策略。每一个改选2的学生都会多得46美分,同时会使他的26个同学分别少得4美分,结果全班收入会少得58美分。等到全体学生一致选择自私的策略,尽可能使自己的收益达到最大,他们将各得50美分。反过来,假如他们联合起来,协同行动,不惜将个人的收益减至最小,他们将各得1。08美元。你会怎么抉择?
演练这个博弈的时候,起初不允许集体讨论,后来允许一点讨论,以便达成“合谋”,结果愿意合作而选择1的学生总数从3到14不等。在最后的一次带有协议的博弈里,选择1的学生总数是4,全体学生的总收益是15。82美元,比全体学生成功合作可以得到的收益少了13。34美元。“我这辈子再也不会相信任何人了。”领导合谋的学生这样嘟囔。那么,他自己又是怎么选择的呢?“噢,我选了2。”他答道。
政治家们也会变成同样的困境中的囚徒。1984年,大多数人都很明白,美国联邦预算赤字实在太高了。裁减必要的巨额开支在政治上并不可行,因此,大幅增税应该是不可避免的。不过,谁愿意担当政治领导角色带头主张这么做呢?民主党总统候选人沃尔特·蒙代尔想要在自己的竞选活动当中为这么一个政策转变制造声势,却被罗纳德·里根打得落花流水,因为里根许诺绝不加税。里根当选之后,这个议题陷入僵局,无论你怎么划分政治派别,民主党对共和党,众议院对参议院,还是政府对国会,各方都希望把提出加税的主动权推给对方。
双方都知道,联合起来共同倡议加税和削减开支,可以共同分享荣誉,分担谴责。这么做与同时坚守被动,眼看巨额赤字上升而无所作为相比,显然会对整个国家更有利,即便对他们自己的政治生涯从长期而言也会有好处。反过来,假如自己提出这样的政策,而对方坚守被动局面,并不附和,自己就会落得最糟糕的下场。从各方的角度看,最好的结果在于,对方有人提出加税和削减开支,并因此不得不付出政治代价。
我们可以将这个情况变成一个博弈。双方分别是民主党和共和党。为了表示谁更加倾向于怎么做,显而易见,对每一方而言,保持被动是一个优势策略。而这正是真实发生的情况:这一届国会根本没有作出任何加税决定。这就是为什么美国是世界上最富有的国家,却同时又是最大的债务国的原因。
启示:这些情景使我们回想起尤塞里安在约瑟夫·海勒的小说《第22条军规》当中的境遇。故事的背景是:第二次世界大战胜利在望,可是为了给自己捞取功劳,一个飞行大队的指挥官没完没了地提高下属的任务定额,弄得所有人都人心惶惶。投弹手尤塞里安不想成为胜利前夕最后一批牺牲者,千方百计逃避执行任务。他的上级军官问:“可是,假如我方士兵都这么想呢(意思是“你不扛枪,我不扛枪,谁来保卫家”)?”可尤塞里安答道:“那我若是不这么想,岂不就成了一个大傻瓜?”
学生与囚犯
“囚徒困境”不仅可以解释政治、经济领域的竞争,在广阔的社会生活中,这一困境的影响也随处可见。例如,我国目前的基础教育,可以说就是一个“囚徒困境”。
最近10多年来,应试教育的弊端已经为社会公认,目前要求“减负”的不仅是中小学生和学生家长,也是教育专家和教育管理部门,也可以说是全社会的呼声。教育管理部门这几年做了一系列的工作,但收效甚微,并没有从根本上解决问题。
很少有人否认,学校不断给学生增加负担是目前教育的实际状况。同样,大家普遍认为呆板僵化的应试教育扼杀了学生的创造性。无论是专家还是家长,都在呼吁改变应试教育的模式。但是无论你是否意识到教育有问题,你的小孩都必须接受这个教育。如果没有改变整体性的教育体制,个别人、个别学校、个别地方单独改变都可能使其付出代价。每个家长都会这样想:尽管这种教育不好,但是其他小孩采取的是这种教育,衡量标准(如中考、高考)也是依据这种教育,我的小孩如不这样做,在竞争方面就会吃亏。因此,每个孩子和家长已经不知不觉地进入了一个囚徒困境。
如果我国现有的考试制度没有改变,“减负”就是空谈。现在假设国家严格规定:所有的学生都“减负”,少留作业,不补课、不做其他的练习题,是否能解决问题?可以肯定的是,规定即使一时有效,但效果会很快消失,最终极可能的结果是规定成了一纸空文,学生还是要背大书包、拼命做课外作业和各种练习题。
可以说,减负的状态是不稳定的,而“增负”的状态是稳定的均衡。原因就是,目前教育的博弈结构规定了各种行动或行为的收益或好处:获得高分的会进入好的初中、高中,进入好的初中、高中的学生可以考高分进入好的大学。而对于老师和学校来说,学生的升学率高意味着名利双收、饭碗牢靠;如果整个规则都倾向“增负”,“负”又如何减得下来?
从理论上说,摆脱“增负”的囚徒困境的惟一办法是改变教育的博弈结构,即改变博弈规则或游戏规则,让“全面发展”的学生获得更多的机会。可是要在实践中达到这个效果,却又困难重重,除了教育投入不足、师资水平不高等现实问题,最大的难点,是如何找到一个更科学、合理,同时又能保证公平的新的“游戏规则”。
至少在现在,这还是个没有答案的问题。
启示:管理的目的不是让每个人做到最好,而是避免内耗过多。
烟草商为何不反对禁止烟草广告
从上面的例子来看,一旦陷入“囚徒困境”,其中任何一方都无法独善其身,即使双方都有合作意愿,也很难达成合作。那么,有什么办法可以使我们逃脱“困境”?稍后将详细讨论这个问题,这里只说一个外力干预打破困境的例子,它具有一些