博弈论-第8章
按键盘上方向键 ← 或 → 可快速上下翻页,按键盘上的 Enter 键可回到本书目录页,按键盘上方向键 ↑ 可回到本页顶部!
————未阅读完?加入书签已便下次继续阅读!
〃笼中猪〃博弈有许多应用,它可以解释为什么占有更多资源者必须承担更多的义务。
启示:这个例子描述了走出囚徒困境的另一个途径:找出一个大慈善家,让它遵守合作协议,并容忍其他人作弊。同样的事情见之于许多联盟。在许多国家,一个大政党和一个或多个小政党必须组成一个联合政府。大政党一般愿意扮演负责合作的一方,委曲求全,确保联盟不会瓦解,而小政党则坚持它们自己的特殊要求,而选择通常可能偏向极端的道路。又如在北约内部,美国承担了防务开支很大比例的份额,大大便宜了西欧和日本。美国经济学家曼库尔·奥尔森将这一现象非常简洁地称为〃小国对大国的剥削〃。
增大未来的影响
通常人们认为合作是件好事,毕竟双方合作在〃囚徒困境〃中对双方都有好处。然而如前面说过的,在一些情形中人们要做的却恰恰相反。
只要这种接触不是重复的,合作就非常困难,正是持续的接触,使基于回报的合作的稳定成为可能。促进双方合作可以从三个方面着手:使得未来相对于现在更重要些;改变对策者的四个可能的结果的收益值;教给对策者那些促进合作的准则、事实和技能。
如果未来相对于现在是足够重要的话,双方的合作是稳定的。因为每个对策者可以用隐含的报复来威胁对方,如果相互之间的接触能持续足够长使得这种威胁能够奏效的话。
这个结论强调了促进合作的第一方法的重要性,即增大未来的影响。有两个基本的方法来做到这一点:使相互作用更持久和使相互作用更频繁。
最直接促进合作的方法是使相互作用更持久。例如,婚礼就是一个用来庆祝和促进持续关系的公共行为。相互作用的持久性不仅对相爱的人有用,对敌人也有用。能证明这一点的最令人吃惊的例子就是在第一次世界大战的堑壕战期间发展起来的〃你不打我,我也不打你〃的系统。堑壕战与众不同的是敌对双方的部队要相互接触很长的时间。在更机动的战争中,一支部队在每次战斗中可能遭遇不同的敌人。因此,你希望对方的个体或小单位将会在以后回报你,而合作是没有好处的。但是在相对固定的战斗中,两支部队之间的接触要持续一个相当长的时间。这种持续的接触,使得基于回报的合作是值得一试的,并且使合作得以建立。
另一个增大未来影响的方法是使接触更加频繁。在下一步接触很快就会发生的情况下,下一步显然比通常更重要。
在商业上,专业化公司趋向于限制在与少数几个公司接触以便使这种接触更加频繁。这是为什么合作在小城镇比在大城市容易出现的一个原因。在某些行业中往往存在着限制竞争的默契,这也是为什么同类行业的公司都试图排斥那些可能扰乱这种默契的新公司。因此,原则总是一样的,经常接触有助于促进稳定的合作。
集中接触是使两个人更经常见面的一个方法。在协商谈判中,另一个使接触更加频繁的方法是把问题分解成若干的部分。例如,可以将军备控制和裁军条约分解成许多阶段,这样就允许双方有更多让步的机遇而不只是一两个让步。这样可以使回报更有效。如果双方都知道对方的一步不合适的策略可以通过下一步的回报来补偿,那么双方对整个过程可以按所期望的进行就更有信心。而且,如果双方对自己识别欺骗的能力缺乏信心,那么,有许多小的步骤比只有少数大的步骤更有助于促进合作。
分解是一个广泛使用的原则。在商业上,商人们喜欢一个大订单分别按每次发货时间付款,而不愿等到最后付总账。使得当前步骤的背叛相对于整个未来的接触过程来说不是那么有诱惑力,这是促进合作的好方法。
启示:两只困倦的刺猬由于寒冷而拥在一起。可因为各自身上都长着刺,于是它们离开了一段距离,但又冷得受不了,于是凑到一起。几经折腾,两只刺猬终于找到一个合适的距离:既能互相获得对方的温暖而又不至于被扎。了解并关心对方,并巧妙地保护自己,会使合作更加长久。
为什么出租比出售好
1987年,纽约市长埃德·科克成功地增加了曼哈顿的持照出租车的数目。此前50年,曼哈顿人口增加了300万,但出租车只多了100辆。出租车短缺的一个迹象是,当时,合法经营一辆出租车的权利(俗称〃大奖章〃)在市场公开标价125000美元。与此同时,出租车按每天两班、每班12小时出租,每班价格约为60美元(每年约45000美元)。
假如市政府拍卖100个新的大奖章,就能轻松地赚到1250万美元。问题是,所有的获得者就会担心,市政府已经发现了一个好得难以置信的发财机会。既然如此,为什么明年不再拍卖100个新的大奖章呢?如果市政府不能承诺限制大奖章的颁发数量,以保证大奖章不会变得一文不值,那么第一个后果就是再也不会有人愿意为大奖章出高价了。
现在科克市长请你做顾问。他想知道怎样才能同时增加出租车的数目和库房收入。他正在寻找办法,使自己作出一个承诺,并以此约束自己(以及以后的政府)不要再源源不断地印制新的许可证,防止旧的大奖章大大贬值。当时,出租车与轿车委员会正左右为难,但谁也不会单单听信一个政客的话。你有什么建议?
诀窍在于出租而非出售大奖章。这么一来,没人要为以后的价值付钱。市长就会有一种限制大奖章出租数量的激励,因为假如他出租太多,总租金就会下降,并且很有可能随着大奖章变得一文不值而一直降到零。
注意,这实际上就是一步一步作出承诺的应用实例。这里的步骤不是大奖章的数目,而是大奖章的有效期。人们愿意在一周或一年之内相信这个市长,而新规定的通过是需要一段时间的。最具风险的是大奖章一年的价值。对市长而言与其将今年的大奖章、明年的大奖章以及未来的大奖章合并为一枚永久性的大奖章,然后再出售,还不如一次只出售一枚大奖章,从而恢复自己的可信度。要做到这一点,一个简单的方法就是出租,而不是出售。
改变收益值
那些碰到〃囚徒困境〃的人有一个共同的反应,即〃应该有一个法律来防止这类事情的发生〃。事实上,摆脱〃囚徒困境〃是政府的一个主要的功能:保证人们无论如何也得做那些对社会有用的事。法律使人们交税,不偷盗,忠实履行与陌生人的合同。这每一件事都可以看作是有许多人参加的大〃囚徒困境〃。没有人愿意纳税,因为它的好处很难看到而代价是直接的。但是如果每一个人都纳税,大家就能生活得更好,即分享学校、道路和其他公共设施的好处。这就是卢梭所说的政府的作用就是保证每一个公民〃被强迫得到自由〃。
政府所做的正是改变有效的收益值。如果你逃避交税,你就可能被送进监狱。这种前景使得背叛的选择不那么吸引人了。即使半官方也能通过改变对策者的收益值而实施他们的规矩。例如,在〃囚徒困境〃的原始故事中,两个同案犯被逮捕并被分别审讯。如果他们同属一个帮派组织,那么他们知道告密是要受到惩罚的。这将降低背叛同伙的收益值,使得他们都不坦白并由于他们双方保持沉默的合作而得到较轻的徒刑。
在收益结构上的大变化能够改变相互作用使得情况不再是一个〃囚徒困境〃。如果对背叛的惩罚是如此之大以至于不管对方如何选择,从短期来说合作都是最好的选择的话,那么就不再有困境。可是,收益值的改变没有必要如此激烈才能奏效,即使相当小的一点改变就可以有助于回报的合作的稳定,尽管这相互作用的情况仍然是〃囚徒困境〃。所以,通过改变收益值来促进合作没有必要去消除背叛的短期激励与合作的长期激励之间的紧张关系,而只要使对双方合作的长期激励大于对背叛的短期激励就行。
教育人们相互关心
在社会中,一个有效促进〃双赢〃的方法是教育人们关心他人的利益。家长和学校花了很大的努力去教育年轻人关心其他人的幸福。用对策论的术语来说,这意味着这些长辈试图使孩子们形成这样的价值观念,即这些新一代的公民的偏好中,不仅有他们自己个人的利益,还至少在某种程度上结合了他人的利益。毫无疑问,在这样一个关心他人的社会里,即使遇到〃囚徒困境〃,成员之间也容易达成合作。
利他主义就是描述这样一个现象,一个人的利益效用是与另一个人的福利相联系的。因此利他主义是一个人行为的动机。但是必须认识到,有一些看起来是宽宏大量的行为可能有其他各种原因而不是利他主义。
例如,慈善行为往往不是出于对不幸者的关心而是为了它所能带来的社会赞赏。在传统和现代社会中赠送礼物可能是交换过程的一部分。它的动机更多的是使受惠者承担某种义务而不在于改善受惠者的福利。
从生物进化的遗传学观点来看,利他主义能在亲属之间维持。冒着生命危险去抢救下一代的母亲能够增加她的基因拷贝的生存机会。这是遗传亲缘理论的基础。
人们之间的利他主义也可以通过社会化来维持。但是,这里有一个严重的问题。一个自私者可以从其他人的利他行为中得到好处而不给以任何回报。
我们都遇见过一些令人讨厌的人,他期望其他人宽宏大量,只考虑自己的需要而不考虑别人的利益。必须把这种人与关心他人的人区别对待,免得被他占便宜。这个道理告诉我们,利他主义的代价可以通过首先对每一个人采用利他行为,然后只对那些有相同的感情的人采取利他行为来控制。但是这很快就使你回到作为合作基础的回报上来。
教育人们要回报
〃一报还一报〃可能是个反击自私者占我们便宜的有效的策略。但是,它是一个人或国家要遵循的道德策略吗?当然,答案取决于什么是一个人的道德标准。也许最广泛接受的道德标准是这一金科玉律:己所不欲,勿施于人。在〃囚徒困境〃的情况下,这一金科玉律似乎意味着你应该总是合作,因为合作是你希望从对方得到的。
这个观点的问题在于:人家打你一巴掌,你还把另一边脸转过去,等于鼓励对方再占你便宜。无条件的合作不仅伤害你自己,而且伤害了这个成功的剥削者接着要遇到的无辜者。无条件合作将会宠坏对方,并为社会留下了改造被宠坏者的负担。这说明回报是比无条件合作更好的道德基础。
然而,基于回报的策略似乎没有达到道德的高度,至少按照我们的日常的直觉是没有。回报当然不是道德的一个好的基础,但它不只是自私自利者的道德。它确实不仅帮助自己,而且帮助了别人。它是通过使剥削性策略难以生存来帮助别人。一个基于回报的策略能让对方从双方合作中得到奖励,这也是当双方最好时它自己所能得到的同样报酬。
坚持公平是许多基于回报的规则的基本特征,这从〃一报还一报〃在〃囚徒困境〃竞赛中的表现可以清楚地看到。〃一报还一报〃赢得两轮的竞赛,但是在任何一局中它从来没有得到比对方多的分数它不可能在一局中比对方得分更多,因为它总是让对方先背叛,并且它从来不会比对方的背叛次数多。它的胜利,不是靠比对方做得好,而是靠引导出对方的合作。用这个方式,〃一报还一报〃靠促进双方的利益而不是靠剥削对方的弱点来取得胜利。一个有道德的人也就不过如此了。
使〃一报还一报〃有点令人不舒服的是它坚持〃以牙还牙〃。这确实只是大致公平的。而且,它的麻烦在于一旦结下仇恨,它就会无休止地继续下去。确实,许多仇恨似乎都有这种性质。例如,世界上很多宗族观念和民族矛盾强烈的地区,家族之间的仇恨有时持续了几十年。一个伤害由另一个伤害来偿还,并且每一次报复都引起了一轮新的报复。这种伤害来回反射直到最初的暴行消失在遥远的过去中。这是〃一报还一报〃的严重的问题。
一个更好的策略可能是一报还9/10报。这样既能够减弱冲突的振荡,又能提供一个激励使对方不敢尝试无缘无故的背叛。它是一个基于回报的但又比〃一报还一报〃多一点宽容的策略。它也是大致公平的。但是在一个自私自利的没有集权的世界里,它确实不仅促进它自己的福利,而且增加其他人的福利。
自我控制的特性给你一个额外的激励去把它传授给别人,即使这些人决不会与你打交道。自然,你想把回报教给那些你将打交道的人以便你能建立一个双方都有好处的关系。但你也可以从那些你决不会与他们相遇的采用回报策略的人那里得到你个人的好处,即其他人的回报惩罚了那些试图占人家便宜的人,这有助于控制整个社会。并且,它减少了你将来必须对付的不合作的人的数目。
启示:一个采用基于回报的策略的社会确实能够自我控制。由于确保了对试图不合作的惩罚,那些不合作的策略就得不到好处。
改进辨别能力
从过去的接触中识别对方,并从中发现对方是否可信的能力对合作的持续是必要的。例如,细菌几乎是进化阶梯底层的生物。只有很有限的识别其他生物的能力,所以它们必须通过捷径来识别,即在一个时间内只和一方(寄主)建立关系。在这种方式下,细菌环境的任何变化都可以归咎于对方。鸟类有更强的辨别力,它们可以通过鸣叫声识别邻居。这种识别力使得它们能够与其他若干的鸟建立合作关系或者至少避免过分的冲突。而人类的辨别能力已经发展到了在他们的大脑中有一个专门的部位来识别面孔的程度。这种识别曾经接触过的个体的能力使得人类可以发展比鸟类更丰富的合作关系。
然而,即使在人类事务中,合作范围的限制往往是由于不能识别其他人的特征和行为而造成的,这里的困难在于核实,即是否有足够的信息确认对方所真正采取的步骤。并不是每个占便宜者都是光明正大的,这使我们在识别之时碰到了一些困难,但是我们也会承认,人的名声往往是和他的真实个性相符的,经过伪装的侵犯仍然是容易识别的,特别是当它一而再,再而三地施展时。
识别背叛什么时候发生的能力不是产生成功合作的惟一要求,但它肯定是一个重要的条件。因此,通过改善对策者的基于过去的接触而相互识别的能力和确定以前已经发生过的行为的能力,持续合作的范围可以得到扩展。
我们已经说明了人们之间的合作能够通过各种技巧来促进。它们包括:未来的影响,改变收益值,教育人们关心他人的福利和教人懂得回报的价值。促进好的结果不仅要告诉对策者:双方合作比双方背叛的所得更多,而且还是一个明确相互作用的特征从而得到一个长期的稳定的合作进化的问题。
启示:持续合作的范围取决于辨别能力。例如,鸟类可以通过鸣叫声识别邻居,这种识别力使得它们能够与其他鸟建立合作关系至少避免过分的冲突。而人类的辨别能力更强。这种识别曾经接触过的个体的能力使得人类可以发展比鸟类更丰富的合作关系。
第4章 战争法则:庙算在先
有〃谈笑间,强虏灰飞烟灭〃的指挥大师,但也同样有〃纸上谈兵〃的〃艺术家〃,有没有什么东西可以更可靠地告诉我们,在