博弈论的诡计(1)-第3章

小说：博弈论的诡计(1) 字数：每页3500字

按键盘上方向键 ← 或 → 可快速上下翻页，按键盘上的 Enter 键可回到本书目录页，按键盘上方向键 ↑ 可回到本页顶部！
————未阅读完？加入书签已便下次继续阅读！

　　　　著名经济学家茅于轼曾经说：“在市场经济以前，人类自利是妨碍别人的，
是损人利己的。”他举了个例子说，过去的帝王与将相就是这样一种博奔，他
可以剥削你，抄你的家；休可以造他的反，夺他的天下。一方得利．一方受
损，那是零和博弈。事实上也正是因为这种零和博弈反复上演，才使中国历
史的每…页都充满r阴谋与血腥，并且使“无毒不狠非丈夫”的文化观念深
入到每一个中国人的意识中。
　　　　然而到了今天，除了权力斗争和军事冲突之外，现实生活中一般很少出
现类似寓言中的狐狸与狼这种“有你没我”的局面。因为在市场经济下，你
要想得到好处，就要跟别人合作，这样才可以得到双赢的结果，不但你得到
好处，你的对手也得到好处。所以市场经济安排最奥妙的地方，就在于它是
双方同意的，任何一个买卖都要经过双方同意，买方也赚钱．卖方也赚钱，
财富就创造出来了：这就是与零和博弈相对应的非零和博弈。
　　　　所谓非零和博弈，是既有对抗又有合作的博弈．各参与者的目标不完全
对立，对局表现为各种各样的情况。自时候参与者只按本身的利害关系单方
面做出决策．有时为了共同利益而合作。其结局收益总和是可变的，参与者
可以同时有所得或有所失。
　　　　比如在拉封丹的寓言中，如果狐狸看到狼在井口，心想我在井里受罪，
你也别想舒服，他不是欺骗狼坐在桶里下来．而是让狼跳下来，那么最终结
局将是狼和狐狸都身陷井中不能自拔。这种两败俱伤的非零和博弈．我们称
之为负和博弈。
　　　　反之，如果狼明白狐狸掉到了井里．动了憾隐之心，搬来一块石头放到
上面的桶中，完全可以利用石头的重量把狐狸拉上来。或者，如果狐狸担心
狼没有这种乐于助人的精神，通过欺骗到达井口以后．再用石头把狼再拉上
来。这两种方式的结局是两个参与者都到了井上面．那么双方进行的就是一
种正和博弈。
　　　　实际上，这种正和游戏的思维不仅是一种经济上的智慧，而且可以运用
到生活中的方方面面．用来解决很多看似无法调和的矛盾和你死我活的僵局。
那些看似零和或者是负和的问题，如果转换一下视角，从更广阔的角度来看，
也不是没有解决办法，而且往往也并不一定要牺牲某一方的利益。
走近博弈论：一场游戏一场梦
　　　　一个冬天的上午，几位读者正在一个社区的图书室看书。这时，一位读
者站起来说：“这屋子里空气实在是太闷了，最好打开窗户透透气。”说着，
他就走到窗户旁边，准备推开窗户。但是他的举动遭到了正好坐在窗户旁边
的一位读者的反对。那位读者说：“大冬天的，外面的风太冲了．一开窗户准
冻感冒了。”于是，一位坚持要开，一位坚决不让开，两个人发生了争执。图
书室的管理员闻声走了过来，问明原因，笑着劝这两位脸红脖子粗的读者各
自坐下，然后快步走刊走廊。把走廊里的窗户打开了一扇。一个看似无法通
融解决的矛盾迎刃而解。
　　　　如果我们每个人都通过博弈智慧的学习和运用．在生活中实现更多的正
和博弈，这个世界也就多了很多和谐，少了很多不必要的争斗。
博弈论的局限性
　　　　有两父子正在赶路，突然从一户人家跑出来一条大黑狗，冲着他们“汪
汪”狂吠。儿子吓了一大跳，急忙躲到了父亲的身后。父亲告诉他说：“你放
心．它不会咬你的。难道你没有听说过‘吠犬不咬人’那句话吗？”儿子听
了这番话，仍然紧紧地抓住父亲的衣角，用颤抖的声音说：“我倒是听说过这
句话，但是我不能肯定这条狗有没有听说过。”
　　　　这番对话之所以可笑，是因为儿子“以己度狗”，把“吠犬不咬人”当做
人狗双方据以确定策略的依据。这种推论自然是错误的。
　　　　但是在这个笑话的背后．我们却可以发现儿子的话中包含着对著名的哥
德尔不完备定理的认识：任何一个理论体系必定是不完全的，任何理论都包
含了既不能证明为真也不能证明为假的命题。对这个世界的最好描述可能
只有其本身，但是正如罗宾逊夫人的妙语所说：“比例尺是一比一的地图是没
用的。”
　　　　博弈论也是如此．比如博奔论的基本假设之一就是：人是理性的。所谓
理性的人是指行动者具有推理能力，在具体策略选择时的目的是使自己的利
益最大化。而现实生活中，人们在做决策时往往是有限理性的。
　　　　因为人类的精力和时间永远是有限的，人不可能具备完全理性，不可能
掌握所有知识和信息。人不可能搜寻到所需的全部信息．另一方面信息的搜
寻也是需要成本的，必须为此付出大最的时间、精力和财力等。意图搜寻到
所有信息，企图做出收益最优的决策行为。有时反而是最不理性的举动。
　　　　尽管如此，人们仍然可以用博弈论与信息经济学的思想方法来分析解决
实际问题。诺坦尔经济学奖获得者保罗t萨缪尔逊说：“要想在现代社会做一
个有文化的人，你必须对博弈论有一个大致了解。”然而，目前国内对于博弈
论的介绍，要么是堆砌庞杂的数学算法与令人炫目的数学模型，使之变成束
之高阁、不能亲近的高深学问；要么是企图“以其昏昏，使人昭昭”，使用混
乱模糊的理解把博弈论随意滥用在任何可能的领域与分析中。
　　　　事实上，要求博弈论能够完全刻画真实的世界．注定是徒劳无功的。正
如诺贝尔经济学奖得主菜因哈德·泽尔滕教授所说：“博弈论并不是疗法，也
不是处方，它不能帮我们在赌博中获胜．不能帮我们通过投机来致富，也不
能帮我们在下棋或打牌中赢对手。它不告诉你该付多少钱买东西，这是计算
机或者字典的任务。”
　　　　尽管如此．人类至今还没有找到一种比博弈论更好的思考工具，可以对
现实的客观世界进行如此近似的描述。就像并不完美的力学是自然科学的哲
学和数学一样，博弈论是社会科学的力学和数学。没有牛顿力学我们连最简
单的物理现象都无法理解：同样的道理．没有博弈论我仍也无法解释分析很
多现实的社会现象。
　　　　为了协调缺陷与现实之间的矛盾，也许我们要听一下博弈论大师鲁宾斯
坦的教导：“一个博弈模型是我们关于现实的观念的近似，而不是现实的客观
描述的近似。”
第2章
第么章
囚徒困境：自愿坐牢的嫌疑人
看着你离去后空荡的房间
我的泪水又有谁看见
不是我不懂温柔和留恋
是谁让你如此的背叛
——《无情的背叛》歌词
克格勃们的小花招
　　　　在斯大林时代的苏联，有一位乐队指挥坐火车前往下一个演出地点。正
当他在车上翻看当晚就要指挥演奏的作品乐谱时。两名克格勃（KGB，苏联
国家安全警察。实际是政治特务）将他作为间谍逮捕了。他们以为那乐谱是
某种密码，这位乐队指挥争辩说那只是柴可夫斯基的小提琴协奏曲，却无济
于事。在乐队指挥被投入牢房的第二天，审问者自鸣得意地走进来说：“我看
你最好还是老实招了吧，我们已经抓住你的朋友柴可夫斯基了．他这会儿正
向我们交代呢。你如果再不招就枪毙了你。如果交代了，只判你10年。”
　　　　笑过之后，每个人都会思考其中所蕴涵的东西。但是如果认为这个笑话
仅仅讽刺了克格勃特务的无知与无耻，那是不够的。事实上，克格勃们的花
招，是想运用博弈论中囚徒困境理论，达到自己的目的。虽然他们未必知道
博弈论，但是他们明显企图运用其中的布局，使乐队指挥被迫选择招供。
　　　　i950年，担任斯坦福大学客座教授的数学家图克（Tucker），给一些心理
学家解释他正在研究的完全信息静态博弈问题，为r更形象地说明博弈过程．
他用两个犯罪嫌疑人的故事构造了一个博弈模型．即囚徒嗣境模型…
　　　　这一模型的过程具体是这样的：两个共同偷窃的犯罪嫌疑人甲和乙被带
进警察局警方对两名犯罪嫌疑人实行隔离关押．隔离审讯，每个犯罪嫌疑
人都无法观察到『司伴的选择
　　　　警方怀疑他们作案，但手中并没有掌握确凿证据，于是明确地分别告知
两名犯罪嫌疑人：对他们犯罪事实的认定及相应的量刑完全取决于他们自己
的供认如果其中一方与警方合作，供认偷窃之事．而对方抵赖．供认打将
不受惩罚，无罪释放．另一方则会被判重刑10年；如果双方都与警方合作共
同供认，各被判刑5年；而如果双方均不认罪．因为警察找不到其他证据．
则无罪释放
　　　　两名囚徒面临的选择及其带来的后果组合可以用表2·I来表示…
表2．1
囚徒困境博弈憧盐矩阵
　　　　哪一种选择对犯罪嫌疑人更有利呢？
　　　　从上表中可以知道：每个犯罪嫌疑人都有两种可供选择的策略：供认或
不供认而且，每个犯罪嫌疑人选择的最优策略不依赖于其同伙的策略选择。
　　　　如果甲选择抵赖．那么就可能会出现两种情况：如果乙选择供认．那么
甲将被加重惩罚．判刑10年．而乙则无罪释放：如果乙也同样选择抵赖，那
么他们两个都将因证据不足而被释放。很显然．这第二种结果对于两个人都
是最有利的但是．因为警方没有把两名嫌疑人放在一间囚室里．因而这种
合作难以顺利进行．使得结果预测的不确定性加大．或者说增加了抵赖合作
的风险性
　　　　因此．基于人是理性的这一前提．由于犯罪嫌疑人不知道对方的想法．
最理性的博弈策略．就是选择供认。这时的策略．我们可以称为占优策略
一
《砬
囚徒困境：自愿坐牢的嫌疑人
而如果所有参与人都有占优策略存在，那么博弈将在所有参与人的占优策略
的基础上达到均衡．这种均衡称为占优策略均衡。
　　　　在囚徒困境中“甲供认，乙供认”的占优策略均衡中，不论所有其他参
与人选择什么繁略，一个参与人的优势策略都是他的最优策略。不管甲乙两
人谁供认．都将得到减轻惩罚的结果：如果甲供认了，乙抵赖，甲将免于惩
罚．如果乙也供认了，那么罪名各担一半，从甲个人看来。也减轻了惩罚；
甲乙互换位置，结果依然是一样。显然，这一策略一定是所有其他参与人选
择某一特定策略时该参与人的占优策略。
　　　　与占优策略相对应，劣势策略则是指在博弈中，不论其他参与人采取什
么策略．某一参与人可能采取的策略中，对自己严格不利的策略。劣势策略
是我们在日常生活中不应该选择的行动。
　　　　有一个要注意的问题是，采用优势策略得到的最坏结果，并不一定比采
用另外一个策略得到的最佳结果要好．这是很多博弈论普及书中容易出错的
一个问题。应该说，参与人采用优势策略时．无论对方采取任何策略总能够
显示出优势。
　　　　由于囚徒困境的模型是如此有趣和简洁．不仅给人们留下了深刻的印象，
而且迅速不胫而走．成为一个被人们广为谈论和研究的博弈模型。在我们开
头的那个笑话中，克格勃们的思路是这样的——乐队指挥知道我们抓住了“柴
科夫斯基”，就必然会考虑：这个“柴科夫斯基”如果交代，我有两种选择——
不交代教枪毙，交代则被判10年。那么此时，我的最好选择是交代。当然，
如果对方不交代，我的最好选择也是交代。
　　　　如果不是这些克格勃因为过于无知．不知道柴科夫斯基是19世纪俄罗斯
最伟大的作曲家．并且早在1893年就去世的话．这个设计本来是天衣无缝的。
从这个角度说下下人有上上之智，也并不为过。
　　　　在囚徒困境的模型中．有一个背景需要向国内的朋友介绍，那就是辩诉
交易。曾经有国内学者在批评囚徒困境时指出：“是否招供并非定罪的充分、
必要条件，定罪的充要条件是证据，有了证据不招供亦可定罪，没有证据
即使招供（证言），也不能定罪。”这种说法其实恰恰反映了对辩诉交易缺乏
了解。
囚徒困境：自愿坐牢的嫌疑人
而如果所有参与人都有占优策略存在，那么博弈将在所有参与人的占优策略
的基础上达到均衡．这种均衡称为占优策略均衡。
　　　　在囚徒困境中“甲供认，乙供认”的占优策略均衡中，不论所有其他参
与人选择什么繁略，一个参与人的优势策略都是他的最优策略。不管甲乙两
人谁供认．都将得到减轻惩罚的结果：如果甲供认了，乙抵赖，甲将免于惩
罚．如果乙也供认了，那么罪名各担一半，从甲个人看来。也减轻了惩罚；
甲乙互换位置，结果依然是一样。显然，这一策略一定是所有其他参与人选
择某一特定策略时该参与人的占优策略。
　　　　与占优策略相对应，劣势策略则是指在博弈中，不论其他参与人采取什
么策略．某一参与人可能采取的策略中，对自己严格不利的策略。劣势策略
是我们在日常生活中不应该选择的行动。
　　　　有一个要注意的问题是，采用优势策略得到的最坏结果，并不一定比采
用另外一个策略得到的最佳结果要好．这是很多博弈论普及书中容易出错的
一个问题。应该说，参与人采用优势策略时．无论对方采取任何策略总能够
显示出优势。
　　　　由于囚徒困境的模型是如此有趣和简洁．不仅给人们留下了深刻的印象，
而且迅速不胫而走．成为一个被人们广为谈论和研究的博弈模型。在我们开
头的那个笑话中，克格勃们的思路是这样的——乐队指挥知道我们抓住了“柴
科夫斯基”，就必然会考虑：这个“柴科夫斯基”如果交代，我有两种选择——
不交代教枪毙，交代则被判10年。那么此时，我的最好选择是交代。当然，
如果对方不交代，我的最好选择也是交代。
　　　　如果不是这些克格勃因为过于无知．不知道柴科夫斯基是19世纪俄罗斯
最伟大的作曲家．并且早在1893年就去世的话．这个设计本来是天衣无缝的。
从这个角度说下下人有上上之智，也并不为过。
　　　　在囚徒困境的模型中．有一个背景需要向国内的朋友介绍，那就是辩诉
交易。曾经有国内学者在批评囚徒困境时指出：“是否招供并非定罪的充分、
必要条件，定罪的充要条件是证据，有了证据不招供亦可定罪，没有证据
即使招供（证言），也不能定罪。”这种说法其实恰恰反映了对辩诉交易缺乏
了解。
囚徒困境：自愿坐牢的嫌疑人
　　　　所谓辩诉交易，又称辩诉协商或者辩诉协议，是指检察官和辩护律师在
法院开庭审判之前，对被告人的定罪和量刑问题进行协商和讨价还价，检察
官通过降低指控或者向法官提出减轻量刑的建议．来换取被告人做有罪答辩
的一种活动。1970年，美国联邦最高法院在“布雷迪诉黄利坚合众国政府”
一案的判决中，正式确定了辩诉交易的合法地位。此后，辩诉交易在美国、
英国等西方国家广泛发展起来．并成为诉讼中解决刑事案件的一种主要方式。
　　　　在囚徒困境的案例中．均衡点是建立在两个囚徒非合作的基础上的，并
且两者的非合作还可以获得一定的利益（从宽惩罚），如果没有辩诉交易提供
的从宽处罚这一利益条件，那么这个严格优势策略也就不复存在。
不背叛就会被淘汰
　　　　在明代宋濂的《宋文宪公全集

返回目录上一页下一页回到顶部赞（0）踩（0）

第3章

博弈论的诡计(1)-第3章

你可能喜欢的