策略思维-第6章
按键盘上方向键 ← 或 → 可快速上下翻页,按键盘上的 Enter 键可回到本书目录页,按键盘上方向键 ↑ 可回到本页顶部!
————未阅读完?加入书签已便下次继续阅读!
① 如果一定要说实话,这是巴里事后懊悔自己没有采取的策略。当时是凌晨3点,他已经喝了太多香槟,再也没有办法保持头脑清醒了。结果,他把200美元押在偶数上,心里嘀咕他输掉冠军宝座的惟一可能性就是这一轮他输并且她赢,而这种可能性的发生几率只有1:5 ,所以形势对他非常有利。当然,几率为1:5 的事情有时也会发生,这里讲的就是其中的一个例子:她赢了。
第2章 准备接招
1 .轮到你了,查理·布朗
连环漫画《花生》里有一个反复出现的主题,说的是露西(Lucy)将一个橄榄球按住,竖在地上,招呼查理·布朗(Charlie Brown)过去踢那个球。不过,每次到了最后一刻,露西总要拿走橄榄球,查理·布朗因为一脚踢空,仰天跌一跤,心怀不轨的露西就会高兴得不得了(如图2…1所示)。
任何人都会劝告查理·布朗不要上露西的当。即便露西去年(以及前年和再前一年)没有在他身上玩过这个花招,他也应该从其他事情了解她的性格,完全有可能预见她会采取什么行动。
就在查理盘算要不要接受露西的邀请跑去踢球的时候,她的行动还没有发生。不过,单凭她的行动还没有发生这一点,并不意味着查理就应该把这个行动看做是不确定性的。他应该知道,在两种可能的结果——让他踢中那个球以及让他仰天跌一跤——当中,露西倾向于后者。因此,他应该预见到,一旦时机到了,她就会拿走橄榄球。从逻辑推理得出的露西会让他踢中那个球的可能性实际上已经毫无影响。对这么一种可能性仍然抱有信心,套用约翰逊(Johnson)博士描述的再婚的特征,是希望压倒经验的胜利。查理不应该那样想,而应预见到接受露西的邀请最终会让自己仰天跌一跤。他应该拒绝露西的邀请。
2 .两种策略互动
策略博弈的精髓在于参与者的决策相互依存。这种相互影响或互动通过两种方式体现出来。第一种方式是相继发生,比如查理·布朗的故事。参与者轮流出招。每个参与者在轮到自己的时候,必须展望一下他的这一步行动将会给其他人以后的行动造成什么影响,反过来又会对自己以后的行动造成什么影响。
第二种互动方式是同时发生,比如第1章囚徒困境故事的情节。参与者同时出招,完全不理会其他人刚刚走了哪一步。不过,每个人必须心中有数,知道这个博弈游戏存在其他参与者,而这些人反过来也非常清楚这一点,如此类推。因此,每个人必须设想一下若是自己处在其他人的位置,会做出什么反应,从而预计自己这一步会带来什么结果。他选择的最佳策略也是这一全盘考虑的一个组成部分。
一旦你发现自己正在玩一个策略博弈,你必须确定其中的互动究竟是相继发生的还是同时发生的。有些博弈,比如橄榄球,同时具备上述两种互动元素。这时候你必须确保自己的策略符合整个环境的要求。在这一章,我们将粗略介绍一些有助于你玩相继发生的互动的博弈的概念和规则;而同时发生的互动的博弈将是第3章的主题。我们从非常简单、有时候是设计出来的例子开始,比如查理·布朗的故事。我们有意这么做,毕竟,这些故事本身并不十分重要,而正确的策略通常也是通过简单的直觉就能发现的,这么一来,可以更加清晰地凸显其中蕴涵的概念。我们用到的例子会在案例分析以及以后的章节里变得越来越接近现实生活,也越来越复杂。
3 .策略的第一法则
相继出招的博弈有一个总的原则,就是每一个参与者必须预计其他参与者接下来会有什么反应,据此盘算自己的最佳招数。这一点非常重要,值得确立为策略行为的一个基本法则。
法则1:向前展望,倒后推理。
展望你的最初决策最后可能导致什么结果,利用这个信息确定自己的最佳选择。
在查理·布朗的故事里,做到这点对所有人来说应该都是不费吹灰之力的,只有查理·布朗除外。他只有两个选择,其中一个导致露西在两个可能的招数之间选择了一个。大多数策略情况都会涉及一系列更长的决策结果,每个结果都有几种选择,单是口头上进行推理实在是无法表述清楚。要想成功地运用这个向前展望、倒后推理的法则,我们需要一个更好的视觉辅助工具。一个涵盖了博弈当中全部选择的“树状图”就是这么一个工具。现在我们就来演示一下怎么使用这些树。
4 .决策树与博弈树
一系列需要向前展望、倒后推理的决策,甚至有可能出现在一个孤立的决策者面前,而这个人并非置身于一个有其他人参加的策略博弈中。对于走在黄树林里的罗伯特·弗罗斯特(Robert Frost) :
两条路在树林里分岔,而我
我选择人迹罕至的那一条,
从此一切变了样。'1'
我们可以画出这样一幅示意图(如图2…2 所示)。
许多人走的路
黄树林
人迹罕至的路
到此未必就不用再选择了。每一条路后面可能还会有分岔,图2…2 相应也会变得越来越复杂。以下就是我们亲身经历的一个例子。
从普林斯顿到纽约旅行会遇到几次选择。第一个决策点是选择旅行的方式:乘公共汽车、乘火车还是自己开车。选择自己开车的人接下来就要选择走费拉扎诺·奈罗斯桥、荷兰隧道、林肯隧道还是乔治·华盛顿桥。选择搭乘火车者必须决定是在纽瓦克(Newark)换乘PATH列车〃还是直达纽约宾夕法尼亚车站。等到进入纽约,搭乘火车或公共汽车的人还必须决定怎样抵达自己的最后目的地,是步行、乘地铁(是本地地铁还是高速地铁)、乘公共汽车还是乘出租车。最佳决策取决于多种因素,包括价格、速度、难以避免的交通堵塞、纽约城里的最终目的地所在以及对泽西收费公路上的空气污染的厌恶程度,等等。
图2…3 描述了你在每一个岔道口面临的选择,看上去就像一棵枝叶繁茂的大树,所以称为“决策树”。如何正确使用这样一张图或这么一棵树呢?绝对不是选择第一个岔道口看上去最好的分枝,然后等到下一个岔道口出现再去思考接下来应该怎么办;相反,你应该预计到以后将面临的选择,利用这些信息倒过头来确定前面几个岔道口你应该怎么决断。举个例子,假设你要去华尔街,乘PATH火车就好于开车,因为这条铁路从纽瓦克直达华尔街。
公共汽车 市内交通
在纽瓦克换乘PATH列车 市内交通
普林斯顿 火车
直达宾夕法尼亚车站 市内交通
费拉扎诺·奈罗斯桥
小汽车 荷兰隧道
林肯隧道
乔治·华盛顿桥
我们可以通过一棵这样的树描述一个策略博弈当中的选择,不过,现在出现了一个新的元素。我们遇到一个有两个人或更多人参与的博弈。沿着这棵树出发,后面许多分枝可能是几个参与者轮流决策。每个参与者在前一个分枝做决策时必须向前展望,而且考察的范围不应仅局限于他自己的决策,还要包括其他参与者的决策。他必须对其他人的下一步决策进行预计,办法就是置身于其他参与者的地位,按照他们的思维方式进行思考。为了强调一下这个做法与前面一个做法的区别,我们把一棵反映一场策略博弈当中的决策次序的树称为“博弈树”,而把“决策树”留做描述只有一个人参加的情形。
虽然查理·布朗的故事简单得简直令人难以置信,不过,你还是可以通过将这个故事放进一棵博弈树,开始熟悉博弈树的概念。这个博弈从露西发出邀请开始,查理·布朗面临的选择是要不要接受邀请。假如查理拒绝邀请,那么这个博弈到此为止。假如他接受,露西就有两个选择,一是让查理踢中那个橄榄球,二是把球拿走。我们可以通过添加一个分枝的方法描绘这个故事。
正如我们在前面说过的那样,露西有两个选择,即图2…4中的上下两个分枝,查理应该预计到她一定会选择上面那个分枝。因此,他应该置身于她的地位,从这棵树上剪掉下面那个分枝。现在,回到他自己的两个选择,也是上下两个分枝,假如他选择上面那个分枝,结果一定是仰天跌一大跤。因此,相比之下,他更好的选择是沿着下面的分枝前进。
把球拿走
露西
接受
查理 让查理踢
拒绝
图2…4
为了进一步了解这个思路,我们不妨设想一个包含同样一棵博弈树的商界中的例子。我们不想惹恼任何一个真实存在的公司,在此先向格雷厄姆·格林(Graham Greene)道歉,我们借用的是他的例子:假设在卡斯特罗执政之前的古巴,吸尘器市场由一家名为“快洁”的公司独占,一家名为“新洁”的新公司正在考虑要不要进军这个市场。假如‘新洁”决定进入,“快洁”将面临两个选择:一是接纳“新洁”,和平共处,满足于一个与以前相比降低了的市场份额,二是打一场价格战。① 假设“快洁”接纳“新洁”;后者就可以赚得10万美元利润,但是,假如“快洁”发动一场价格战,就将给“新洁”造成20万美元的损失。假如“新洁”决定留在市场外而不进入,那么它的利润当然为零。下面我们画出这棵博弈树(如图2…5 所示),标明每一种结果会带来什么样的利润。
① 在格林(Greene)写的《我们在哈瓦那的人》(Our Man in Havana)一书中,为这两家公司当中一家工作的销售员决定打仗,只不过用的是毒药而不是价格。
接纳 新洁得10万美元
快洁
打价格战 新洁亏20万美元
进入
新洁
不进入 新洁得0 美元
图2…5
“新洁”应该怎么办?这是决策分析员需要解决的问题,也是商学院里讲授的问题。他们会画出一幅非常相似的图,却称之为“决策树”。理由是,他们通常把“接纳”和“打价格战”两种选择方案的结果看做偶然现象。因此他们会标出两者的出现概率。比如,假如他们认为接纳与打价格战出现的机会一样大,那么两者的概率同为1/2。接着,他们可以计算出“新洁”进人市场会得到多少利润,方法是将盈利和损失分别乘以相应的概率再相加。他们得到
1/2*100000…1/2*200000=…50000
由于这是一个亏损数字,商业分析员们就会根据这些概率下结论说“新洁”不应该进军古巴市场。
以上的估计数字是从哪里来的呢?博弈论提供了答案:它们来自“新洁”自己对“快洁”在各种情形下的利润情况的估计。要估计“快洁”会怎么做,“新洁”首先应该估计“快洁”在不同情形下会得到多少利润。然后通过向前展望、倒后推理,预计对方会怎么做。进一步分析这个例子:我们假设“快洁”作为一个垄断者,有能力赚取30万美元利润。与“新洁”分享市场则意味着自己的利润降为10万美元。另外,从“快洁”这边估计,发动一场价格战的代价是10万美元。现在我们可以在这棵树上添加这些结果(如图2…6 所示)。
接纳 新洁得10万美元快洁得10万美元
快洁
打价格战 新洁亏20万美元快洁亏10万美元
进入
新洁
不进入 新洁得O美元快洁得30万美元
图2…6
我们利用这棵树包含的信息预计以后的全部招数。由于具体招数可以由这个博弈的结果确定,这棵树完全适合看做一棵博弈树,而不是一棵决策树。比如,要预计“快洁”对“新洁”进入的反应,我们知道,“快洁”接纳“新洁”的话仍会有10万美元利润,发动价格战则会损失10万美元;“新洁”应该预计到“快洁”会选择前者。向这个方向展望,同时倒后推理,“新洁”应该在盘算的时候先把打价格战这个分枝去掉。它应该进入这个市场,因为预计它可以赚到10万美元。
若是换了其他环境,最后的决策可能发生变化。比如,假设“新洁”下一步有可能继续进军“快洁”早已建立市场的其他岛屿,“快洁”大约会觉得有必要在这个新来者面前摆出一副不好对付的样子,宁可在古巴损失10万美元也要发动一场价格战。“新洁”应该看到,这意味着自己注定会损失20万美元,最后决定还是留在外面,不要硬闯的好。
“新洁”可以看出任何一个得失数字都会转化为相应的行动。不过,它自己可能并不知道“快洁”在这棵树的顶端会得到什么样的回报。这种利润的不确定性将会转化为行动的不确定性。比如,“新洁”可能认为,有33。3%的机会“快洁”会在一场价格战中损失10 万美元,有33。3%的机会双方会打个平手(利润为零),最后还有33。3%的机会“快洁”即便打价格战也能赚到12万美元。若遇到这种情况,“向前展望,倒后推理”会认为,有2/3 的概率“快洁”会选择接纳“新洁”——赚到10万美元总比损失10万美元或双方打个平手要好,只比不上赚到12万美元。因此,发动一场价格战的可能性是33。3%。要弄清究竟会发生什么情况,惟一途径就是进军市场。不过,基于上述可能性,“新洁”有2/3 的概率赚到10万美元,1/3 的概率损失20万美元,因此,它的预计利润实际为零,根本没有理由进军市场。
在这个例子里,“新洁”对于“快洁”的得失的不确定性直接转化为对“快洁”会有什么反应的概率估计。不过,我们必须注意应该在哪里加人这种不确定性。正确的地方是在树的末端。现在就来看看,假如我们在考虑的时候企图跳到前面去会犯什么错:平均而言,“快洁”可以在一场价格战当中赚到6667(即1/3*120000+1/3*0…1/3*100000 )。但这并不意味着“快洁”就一定想打价格战。愿意打价格战的可能性不是100%。而且这种不确定性并不表示我们就应该猜测“快洁”愿意打价格战的可能性是50%。对“新洁”而言,分析这个问题的正确思路是从这个博弈的终点着手,预计“快洁”每一步会怎么做。
5 .更加复杂的树
在现实生活里,你会遇到的博弈远比上述我们用来进行形象描述的例子复杂。不过,即便这些“小树苗”长成“大树”,同样的原理也依然管用。象棋(国际象棋)可能是最好的例子。虽然象棋的规则相对比较简单,却已经形成一种需要进行策略推理的博弈游戏。白棋先行,黑棋回应,双方依次相继移动。因此,象棋当中最“纯粹”的策略推理就包含着向前展望你自己这一步将会导致什么后果,就跟我们在前面看到的一样。其实例可能是这样:“假如我现在走兵,我的对手就会进马,威胁我的车。我在走兵之前必须用我的象护住那四个格子,不让对手的马得逞。”
象棋是一种相继出招的博弈游戏,我们可以用一棵树来表示。白方可以从20种开局方式中任选一种。'2'在图2…7 中,我们用这棵树的第一个决策点(或节点)表示白方拥有的第一个先行机会,标为W1。他可以选择的20种走法变成20个枝条,从这个节点发散出去。每一个枝条代表的行动方式就是这个枝条的标签:兵进K4 (P…K4 或代数标记法里的e4)、兵进Q4 ,等等。我