博弈论的诡计(1)-第3章
按键盘上方向键 ← 或 → 可快速上下翻页,按键盘上的 Enter 键可回到本书目录页,按键盘上方向键 ↑ 可回到本页顶部!
————未阅读完?加入书签已便下次继续阅读!
著名经济学家茅于轼曾经说:“在市场经济以前,人类自利是妨碍别人的,
是损人利己的。”他举了个例子说,过去的帝王与将相就是这样一种博奔,他
可以剥削你,抄你的家;休可以造他的反,夺他的天下。一方得利.一方受
损,那是零和博弈。事实上也正是因为这种零和博弈反复上演,才使中国历
史的每…页都充满r阴谋与血腥,并且使“无毒不狠非丈夫”的文化观念深
入到每一个中国人的意识中。
然而到了今天,除了权力斗争和军事冲突之外,现实生活中一般很少出
现类似寓言中的狐狸与狼这种“有你没我”的局面。因为在市场经济下,你
要想得到好处,就要跟别人合作,这样才可以得到双赢的结果,不但你得到
好处,你的对手也得到好处。所以市场经济安排最奥妙的地方,就在于它是
双方同意的,任何一个买卖都要经过双方同意,买方也赚钱.卖方也赚钱,
财富就创造出来了:这就是与零和博弈相对应的非零和博弈。
所谓非零和博弈,是既有对抗又有合作的博弈.各参与者的目标不完全
对立,对局表现为各种各样的情况。自时候参与者只按本身的利害关系单方
面做出决策.有时为了共同利益而合作。其结局收益总和是可变的,参与者
可以同时有所得或有所失。
比如在拉封丹的寓言中,如果狐狸看到狼在井口,心想我在井里受罪,
你也别想舒服,他不是欺骗狼坐在桶里下来.而是让狼跳下来,那么最终结
局将是狼和狐狸都身陷井中不能自拔。这种两败俱伤的非零和博弈.我们称
之为负和博弈。
反之,如果狼明白狐狸掉到了井里.动了憾隐之心,搬来一块石头放到
上面的桶中,完全可以利用石头的重量把狐狸拉上来。或者,如果狐狸担心
狼没有这种乐于助人的精神,通过欺骗到达井口以后.再用石头把狼再拉上
来。这两种方式的结局是两个参与者都到了井上面.那么双方进行的就是一
种正和博弈。
实际上,这种正和游戏的思维不仅是一种经济上的智慧,而且可以运用
到生活中的方方面面.用来解决很多看似无法调和的矛盾和你死我活的僵局。
那些看似零和或者是负和的问题,如果转换一下视角,从更广阔的角度来看,
也不是没有解决办法,而且往往也并不一定要牺牲某一方的利益。
走近博弈论:一场游戏一场梦
一个冬天的上午,几位读者正在一个社区的图书室看书。这时,一位读
者站起来说:“这屋子里空气实在是太闷了,最好打开窗户透透气。”说着,
他就走到窗户旁边,准备推开窗户。但是他的举动遭到了正好坐在窗户旁边
的一位读者的反对。那位读者说:“大冬天的,外面的风太冲了.一开窗户准
冻感冒了。”于是,一位坚持要开,一位坚决不让开,两个人发生了争执。图
书室的管理员闻声走了过来,问明原因,笑着劝这两位脸红脖子粗的读者各
自坐下,然后快步走刊走廊。把走廊里的窗户打开了一扇。一个看似无法通
融解决的矛盾迎刃而解。
如果我们每个人都通过博弈智慧的学习和运用.在生活中实现更多的正
和博弈,这个世界也就多了很多和谐,少了很多不必要的争斗。
博弈论的局限性
有两父子正在赶路,突然从一户人家跑出来一条大黑狗,冲着他们“汪
汪”狂吠。儿子吓了一大跳,急忙躲到了父亲的身后。父亲告诉他说:“你放
心.它不会咬你的。难道你没有听说过‘吠犬不咬人’那句话吗?”儿子听
了这番话,仍然紧紧地抓住父亲的衣角,用颤抖的声音说:“我倒是听说过这
句话,但是我不能肯定这条狗有没有听说过。”
这番对话之所以可笑,是因为儿子“以己度狗”,把“吠犬不咬人”当做
人狗双方据以确定策略的依据。这种推论自然是错误的。
但是在这个笑话的背后.我们却可以发现儿子的话中包含着对著名的哥
德尔不完备定理的认识:任何一个理论体系必定是不完全的,任何理论都包
含了既不能证明为真也不能证明为假的命题。对这个世界的最好描述可能
只有其本身,但是正如罗宾逊夫人的妙语所说:“比例尺是一比一的地图是没
用的。”
博弈论也是如此.比如博奔论的基本假设之一就是:人是理性的。所谓
理性的人是指行动者具有推理能力,在具体策略选择时的目的是使自己的利
益最大化。而现实生活中,人们在做决策时往往是有限理性的。
因为人类的精力和时间永远是有限的,人不可能具备完全理性,不可能
掌握所有知识和信息。人不可能搜寻到所需的全部信息.另一方面信息的搜
寻也是需要成本的,必须为此付出大最的时间、精力和财力等。意图搜寻到
所有信息,企图做出收益最优的决策行为。有时反而是最不理性的举动。
尽管如此,人们仍然可以用博弈论与信息经济学的思想方法来分析解决
实际问题。诺坦尔经济学奖获得者保罗t萨缪尔逊说:“要想在现代社会做一
个有文化的人,你必须对博弈论有一个大致了解。”然而,目前国内对于博弈
论的介绍,要么是堆砌庞杂的数学算法与令人炫目的数学模型,使之变成束
之高阁、不能亲近的高深学问;要么是企图“以其昏昏,使人昭昭”,使用混
乱模糊的理解把博弈论随意滥用在任何可能的领域与分析中。
事实上,要求博弈论能够完全刻画真实的世界.注定是徒劳无功的。正
如诺贝尔经济学奖得主菜因哈德·泽尔滕教授所说:“博弈论并不是疗法,也
不是处方,它不能帮我们在赌博中获胜.不能帮我们通过投机来致富,也不
能帮我们在下棋或打牌中赢对手。它不告诉你该付多少钱买东西,这是计算
机或者字典的任务。”
尽管如此.人类至今还没有找到一种比博弈论更好的思考工具,可以对
现实的客观世界进行如此近似的描述。就像并不完美的力学是自然科学的哲
学和数学一样,博弈论是社会科学的力学和数学。没有牛顿力学我们连最简
单的物理现象都无法理解:同样的道理.没有博弈论我仍也无法解释分析很
多现实的社会现象。
为了协调缺陷与现实之间的矛盾,也许我们要听一下博弈论大师鲁宾斯
坦的教导:“一个博弈模型是我们关于现实的观念的近似,而不是现实的客观
描述的近似。”
第2章
第么章
囚徒困境:自愿坐牢的嫌疑人
看着你离去后空荡的房间
我的泪水又有谁看见
不是我不懂温柔和留恋
是谁让你如此的背叛
——《无情的背叛》歌词
克格勃们的小花招
在斯大林时代的苏联,有一位乐队指挥坐火车前往下一个演出地点。正
当他在车上翻看当晚就要指挥演奏的作品乐谱时。两名克格勃(KGB,苏联
国家安全警察。实际是政治特务)将他作为间谍逮捕了。他们以为那乐谱是
某种密码,这位乐队指挥争辩说那只是柴可夫斯基的小提琴协奏曲,却无济
于事。在乐队指挥被投入牢房的第二天,审问者自鸣得意地走进来说:“我看
你最好还是老实招了吧,我们已经抓住你的朋友柴可夫斯基了.他这会儿正
向我们交代呢。你如果再不招就枪毙了你。如果交代了,只判你10年。”
笑过之后,每个人都会思考其中所蕴涵的东西。但是如果认为这个笑话
仅仅讽刺了克格勃特务的无知与无耻,那是不够的。事实上,克格勃们的花
招,是想运用博弈论中囚徒困境理论,达到自己的目的。虽然他们未必知道
博弈论,但是他们明显企图运用其中的布局,使乐队指挥被迫选择招供。
i950年,担任斯坦福大学客座教授的数学家图克(Tucker),给一些心理
学家解释他正在研究的完全信息静态博弈问题,为r更形象地说明博弈过程.
他用两个犯罪嫌疑人的故事构造了一个博弈模型.即囚徒嗣境模型…
这一模型的过程具体是这样的:两个共同偷窃的犯罪嫌疑人甲和乙被带
进警察局警方对两名犯罪嫌疑人实行隔离关押.隔离审讯,每个犯罪嫌疑
人都无法观察到『司伴的选择
警方怀疑他们作案,但手中并没有掌握确凿证据,于是明确地分别告知
两名犯罪嫌疑人:对他们犯罪事实的认定及相应的量刑完全取决于他们自己
的供认如果其中一方与警方合作,供认偷窃之事.而对方抵赖.供认打将
不受惩罚,无罪释放.另一方则会被判重刑10年;如果双方都与警方合作共
同供认,各被判刑5年;而如果双方均不认罪.因为警察找不到其他证据.
则无罪释放
两名囚徒面临的选择及其带来的后果组合可以用表2·I来表示…
表2.1
囚徒困境博弈憧盐矩阵
哪一种选择对犯罪嫌疑人更有利呢?
从上表中可以知道:每个犯罪嫌疑人都有两种可供选择的策略:供认或
不供认而且,每个犯罪嫌疑人选择的最优策略不依赖于其同伙的策略选择。
如果甲选择抵赖.那么就可能会出现两种情况:如果乙选择供认.那么
甲将被加重惩罚.判刑10年.而乙则无罪释放:如果乙也同样选择抵赖,那
么他们两个都将因证据不足而被释放。很显然.这第二种结果对于两个人都
是最有利的但是.因为警方没有把两名嫌疑人放在一间囚室里.因而这种
合作难以顺利进行.使得结果预测的不确定性加大.或者说增加了抵赖合作
的风险性
因此.基于人是理性的这一前提.由于犯罪嫌疑人不知道对方的想法.
最理性的博弈策略.就是选择供认。这时的策略.我们可以称为占优策略
一
《砬
囚徒困境:自愿坐牢的嫌疑人
而如果所有参与人都有占优策略存在,那么博弈将在所有参与人的占优策略
的基础上达到均衡.这种均衡称为占优策略均衡。
在囚徒困境中“甲供认,乙供认”的占优策略均衡中,不论所有其他参
与人选择什么繁略,一个参与人的优势策略都是他的最优策略。不管甲乙两
人谁供认.都将得到减轻惩罚的结果:如果甲供认了,乙抵赖,甲将免于惩
罚.如果乙也供认了,那么罪名各担一半,从甲个人看来。也减轻了惩罚;
甲乙互换位置,结果依然是一样。显然,这一策略一定是所有其他参与人选
择某一特定策略时该参与人的占优策略。
与占优策略相对应,劣势策略则是指在博弈中,不论其他参与人采取什
么策略.某一参与人可能采取的策略中,对自己严格不利的策略。劣势策略
是我们在日常生活中不应该选择的行动。
有一个要注意的问题是,采用优势策略得到的最坏结果,并不一定比采
用另外一个策略得到的最佳结果要好.这是很多博弈论普及书中容易出错的
一个问题。应该说,参与人采用优势策略时.无论对方采取任何策略总能够
显示出优势。
由于囚徒困境的模型是如此有趣和简洁.不仅给人们留下了深刻的印象,
而且迅速不胫而走.成为一个被人们广为谈论和研究的博弈模型。在我们开
头的那个笑话中,克格勃们的思路是这样的——乐队指挥知道我们抓住了“柴
科夫斯基”,就必然会考虑:这个“柴科夫斯基”如果交代,我有两种选择——
不交代教枪毙,交代则被判10年。那么此时,我的最好选择是交代。当然,
如果对方不交代,我的最好选择也是交代。
如果不是这些克格勃因为过于无知.不知道柴科夫斯基是19世纪俄罗斯
最伟大的作曲家.并且早在1893年就去世的话.这个设计本来是天衣无缝的。
从这个角度说下下人有上上之智,也并不为过。
在囚徒困境的模型中.有一个背景需要向国内的朋友介绍,那就是辩诉
交易。曾经有国内学者在批评囚徒困境时指出:“是否招供并非定罪的充分、
必要条件,定罪的充要条件是证据,有了证据不招供亦可定罪,没有证据
即使招供(证言),也不能定罪。”这种说法其实恰恰反映了对辩诉交易缺乏
了解。
囚徒困境:自愿坐牢的嫌疑人
而如果所有参与人都有占优策略存在,那么博弈将在所有参与人的占优策略
的基础上达到均衡.这种均衡称为占优策略均衡。
在囚徒困境中“甲供认,乙供认”的占优策略均衡中,不论所有其他参
与人选择什么繁略,一个参与人的优势策略都是他的最优策略。不管甲乙两
人谁供认.都将得到减轻惩罚的结果:如果甲供认了,乙抵赖,甲将免于惩
罚.如果乙也供认了,那么罪名各担一半,从甲个人看来。也减轻了惩罚;
甲乙互换位置,结果依然是一样。显然,这一策略一定是所有其他参与人选
择某一特定策略时该参与人的占优策略。
与占优策略相对应,劣势策略则是指在博弈中,不论其他参与人采取什
么策略.某一参与人可能采取的策略中,对自己严格不利的策略。劣势策略
是我们在日常生活中不应该选择的行动。
有一个要注意的问题是,采用优势策略得到的最坏结果,并不一定比采
用另外一个策略得到的最佳结果要好.这是很多博弈论普及书中容易出错的
一个问题。应该说,参与人采用优势策略时.无论对方采取任何策略总能够
显示出优势。
由于囚徒困境的模型是如此有趣和简洁.不仅给人们留下了深刻的印象,
而且迅速不胫而走.成为一个被人们广为谈论和研究的博弈模型。在我们开
头的那个笑话中,克格勃们的思路是这样的——乐队指挥知道我们抓住了“柴
科夫斯基”,就必然会考虑:这个“柴科夫斯基”如果交代,我有两种选择——
不交代教枪毙,交代则被判10年。那么此时,我的最好选择是交代。当然,
如果对方不交代,我的最好选择也是交代。
如果不是这些克格勃因为过于无知.不知道柴科夫斯基是19世纪俄罗斯
最伟大的作曲家.并且早在1893年就去世的话.这个设计本来是天衣无缝的。
从这个角度说下下人有上上之智,也并不为过。
在囚徒困境的模型中.有一个背景需要向国内的朋友介绍,那就是辩诉
交易。曾经有国内学者在批评囚徒困境时指出:“是否招供并非定罪的充分、
必要条件,定罪的充要条件是证据,有了证据不招供亦可定罪,没有证据
即使招供(证言),也不能定罪。”这种说法其实恰恰反映了对辩诉交易缺乏
了解。
囚徒困境:自愿坐牢的嫌疑人
所谓辩诉交易,又称辩诉协商或者辩诉协议,是指检察官和辩护律师在
法院开庭审判之前,对被告人的定罪和量刑问题进行协商和讨价还价,检察
官通过降低指控或者向法官提出减轻量刑的建议.来换取被告人做有罪答辩
的一种活动。1970年,美国联邦最高法院在“布雷迪诉黄利坚合众国政府”
一案的判决中,正式确定了辩诉交易的合法地位。此后,辩诉交易在美国、
英国等西方国家广泛发展起来.并成为诉讼中解决刑事案件的一种主要方式。
在囚徒困境的案例中.均衡点是建立在两个囚徒非合作的基础上的,并
且两者的非合作还可以获得一定的利益(从宽惩罚),如果没有辩诉交易提供
的从宽处罚这一利益条件,那么这个严格优势策略也就不复存在。
不背叛就会被淘汰
在明代宋濂的《宋文宪公全集