mba十日读-第17章
按键盘上方向键 ← 或 → 可快速上下翻页,按键盘上的 Enter 键可回到本书目录页,按键盘上方向键 ↑ 可回到本页顶部!
————未阅读完?加入书签已便下次继续阅读!
“平均事件”这一概念相当含糊。在用应用举例中其定
义延伸到可包括任何一大组的数据。为什么?因为正态分布
易于使用,且和实际生活中的情况又极其相似。市场变化不
定造成股票价格浮动,最终导致或盈或亏的回报结果。回报
可以被认为是市场变化的“平均”值。正如任何事情都可以
用具有平均性来解释一样,正态分布的实用性亦如此。
正态曲线的测量
钟型曲线可用两个名词来描述,即中项(Mean)和标准偏
差(Standard deviation; SD)。中项(μ)是曲线的中心部分,
通常称这个中项为平均值。平均值是用数据加在一起之总和
除以数据点。标准偏差(σ)是衡量偏离平均值的宽窄程度。
在概率概念中,这两个名词是非常重要的。
其中用的较少的衡量一组数据平均值的方法还有“中值”
(Median),即按数字大小排列后的中间项数值,和“众数值”
(Mode); 即一组数据中出现频率最高的数。
和二项式分布一样,曲线下代表所有出现结果的可能之
和为 100%。正态分布曲线特别的地方在于,对于任何已知的
偏离中项、中心的标准偏差,尽管正态分布的形状不同,但
事件的概率相同。
零售业正态分布举例
鞋店老板 Al Bundy 先生想要知道店里的库存能否满足顾客对不同尺寸鞋子的需求。他从鞋业研究中心买了一份女鞋
尺寸调研报告,并通过问卷调查收回了大量数据。
他将收集到的数据画在坐标图上,得到的形状像是一正
态分布。另外,他将鞋的不同尺寸也输入计算器,得到标准
偏差数值是“2”。他还分析了所收到的问卷中的鞋子尺寸平
均值,得到的号码是“7”。再看亲手绘制的图表,确实是个
令人可信的正态分布。
对正态分布图,Al Bundy 先生可以用上分析正态分布曲
线的原理。此原理适用于所有正态分布曲线线下区域:
ISD=0。3413
2SD=0。4772
3SD=0。49865
4SD=0。4999683
依据这一原理,若 Bundy先生库存鞋的号码在5—9之间,
就包括了人群穿鞋号码的68。26%(2×
鞋子尺寸正态分布
0。3413)。库存的号码如果在3—11 之间,就包括了 95。44%。
如果库存的鞋从 1—13 号都有,那么,光顾他商店的 99。73%
顾客就都会满意。对那些低于 1 或高于 13 的特号鞋,他总是
可以随时从别处定得到的。
当然,学有用于确定曲线上任一特殊点处的概率(中项
以外的非整数标准偏差)正态分布表。用此表之前,必须先
算出(Z value),即:
正态分布曲线财务举例
让我们把刚学到的概率论的原理应用到金融上。以每月
回报率波动的先锋航空公司(Pioneer Aviation)股票为例,
假设成正态分布形状。对该股票以往的回报统计表明,平均
值为 1%,标准偏差为 11%。Gerald Rasmussen 先生想知道下
个月股票的回报率低于13%概率是多少。
Z =
(13 …1)
11
= 1。09(离平均值的标准偏差)
概率密度分布函数
先锋航空公司每月股票回报率平均值
每月股票回报率
用新计算出的Z值概念可以计算出:
从附录中的提供的正态分布表可以查到:1。09 标准偏差
=0。3621。和所有正态分布图一样,图中左半部分的概率是
50%。在所有的正态分布中,超过或低于中项的概率是 50%。
根据这些条件,我计算出,该股票回报率低于 13%的概率是
86。21%(即,36。21%+50%),超过 13%的概率是 13。79%(即,
1…86。21%)。这就是用概率理论解决金融上实际问题的具体
例子。
如果不太过分强调理论,概率统计实际并不难。此外,
还有一些其它类型的分布,但商业上用的较少。泊松分布
(Poisson Distribution),和正态分布类似,但图形右侧
尾部展开。但多数分布都被假设是正态分布,以利用正态分
布标准偏差的原理分析问题。
累计分布函数
累计分布函数 ( Cumulative distribution
function;CDF)是对概率分布的累计观察。它分析诸如钟型
曲线等概率集合分布函数,了解“结果出现小于或等于该值
时的概率是多少?”从普通的正态分布曲线,能知道某一已
知结果出现的概率是多少,而累计分布函数能告诉我们一组
已知的价值范围内出现的概率有多大。累计分布函数还可以
用来把我们掌握的概率理论和决策工具(决策树)结合起来。
累计分布函数研究在许多数量价值不确定下所可能出现的结
果的范围。
仍以前文提出的钻井项目为例,分析一下如果地下有油,
其油量价值分布的情况。油量价值 概率集合分布函数 累计分布函数
累计概率
小于或等于
50000 0。005 0。005
75000 0。01 0。015(0。005+0。01)
150;000 0。03 0。045(0。03+0。01+0。005)
200;000 0。08 0。125
300;000 0。12 0。245
750;000 0。15 0。395
1;100;000 0。21 0。605
1;200;000 0。15 0。755
1;400;000 0。12 0。875
1;700;00 0。08 0。955
2;000;000 0。03 0。985
2;500;000 0。01 0。995
6;000;000 0。005
1。00
1。00
概率密度分布函数
先锋航空公司每月股票回报率
平均值
每月股票回报率
在前文的树型图举例中,我们曾假设该项目的收益是
1;000;000 美元。为方便起见,我们取该值为采到油的期望值
(EMV)。实际上该项目出油的结果分布范围较广。从表中可
以看出,出现收益为 6;000;000 美元的概率是 0。5%,出现收
益为50;000 美元的概率也是 0。5%。如果用发生每一概率的金
额乘以其第二列中对应的概率,得出的期望值就等于我们前
面用到过的期望值1;000;000美元。
当决策者不知从何开始着手分析时,用建立累计分布函
数的方法便可使他们得出平均值或期望值。画累计分布函数
是一种有效方法,可将一系列你对未知事件可能出现的高、
中低结果概率的判断结合起来,以得到供决策用的期望值。
一组可能结果的累计密度分布函数图就像一个大的“S”。
在累计密度分布函数中,你一眼就可以看出所有可能的结果,而不仅仅是统计中的几个独立的点。如下图所示,Sam
Houston先生认为,出现的结果可能在0 到6;000;000 美元的
连续区域内。
累计分布函数中的从 0 到 1。0 的概率区域可用中值方法
(Bracket median technique)将之分成“区间”。上图中
的累计分布函数就是用这种方法分为 5 个区间的。例如,你
可将之分成 0。1,0。3,0。5,0。7,0。9 的区间。每个区间分
别代表的便是 0 到 0。2,0。2 到 0。4,0。4 到 0。6,0。6 到 0。8
以及0。8到1。0的“价值区域”的平均值。
概率是 0。5 的区间即是中数,这是因为左右两边各代表
价值的一兰。但这个中数并不一定非是前面正态分布中提到
的平均值。中值仅仅是价值区域的中心,而平均值则是用价
值和发生的对应概率相乘后得到的积,例如在前面采油的举
例中,我们用平均值的方法计算出出油的期望值是 1;000;000
美元。
累计密度分布函数
出油可能结果价值(单位:千美元)
油的价值
为把累计密度分布函数应用到决策树中,以便用出重要
的管理决策,请你考虑一下如何将油井可能产生的价值全部
表示出来。其概率结果应成一“扇形”,代表着“一组”价
值。你也许不可能在树上画出无限根分枝来,所以,让我们
借助于累计密度分布函数的方法来解决问题。
画出累计密度分布函数
要画出如上的累计密度分布函数图,你不仅要使用自己
的研究数据,还要独立进行分析判断。你要对自己提出如下
的一系列问题:
发生的概率或高于或低于50%(中值)时的价值是多少?
发生的概率在较低的区域(10%区间)的价值是多少?
发生的概率在较高的区域(90%区间)的价值是多少?
钻井决策树
使用累计分布函数
EMV=。9'(。2×130 美元)+(。2×750 美元)+(。2×870
美元)+(。2×1150美元)+(。2×2100美元)'根据上述问题的答案,你就可以将自己认为的全部结果
画成累计分布函数图。从累计分布函数中的 5 个区间内,挑
选出 5 个结果,你就可以在决策树上画出树枝似的 5 种可能
结果的扇形概率(Even fan)。
此处的期望财务值和前面第一次提到时的数值是一样
的。我第一次选此值的原因,完全是为了方便读者。
利用 5 个区间的另一种简洁方法叫“皮尔逊·图基法”
(Pearson Tukey Method)。这种方法不用 5 个区间,而是
用 3 个区间,即 5%,50%和 95%三种,而其各自对应的概率分
别是18。5%,63%和18。5%。
在分析重大问题时,人们用蒙特卡罗(Monte Carlo)模
拟程序计算决策树。计算机的计算横型中包括了概率扇形的
累计分布函数以及有关树型图中的有关参数。该程序可对多
种情况进行模拟,让你了解事件发生时的情景。“Fortune”
杂志评选的前500家公司,不少公司就使用这种方法。
当决策树中的某一分枝的期望值不确定时,便可使用累
计分布函数和区间分析法。但是,分析人员自己的判断还是
最重要的。决策树仅仅是 MBA 们基于知识和凭借直觉分析问
题的一种工具而已。
回归分析和预测
线性回归(Linear Regression)模型是分析人员用以凭
借直觉确定多种商业情况下有关变量之间关系的工具。一旦
找到了这种关系,就可以用它来预测将来。普通的线性回归
是用于分析销售额和价格、促销和市场等诸多因素之间的关
系,股票价格和盈利、利息之间的关系以及生产成本和产量
之间的关系。当然,也可以用它来得到诸如“天气温度的变
化对销售冰淇淋的影响如何?”这一问题的答安。此例中,
自变量(Independent variable)X 表示温度,是引起其它数
值变化的变量。因变量(Dependent variable)Y 是销售额。
是温度影响销售,而不是相反。
回归分析要求收集足够的数据,以确定变量之间的关系。
通过相当多的数据点,诸如一年里有关温度的数据及销售的
变化情况,我们便可以温度为 X 轴,销售额为 Y 轴画出图形
来。研究回归的目的是要找到一条能够最准确地描述二者之
间关系的线性等式。回归就是在画出的数据点中间“插入”
一条直线,并尽量使“各点距这条线距离差的平方最小”。这种“最小平方法”(Least squares method)要求做大量
数据的加、减和相乘。在具体计算上,使用计算器或 Lotus1…
2…3软件即可。
线性代数复习
在学习回归的具体例子之前,先让我们复习一下线性代
数的一些基本概念。代表直线的线性方程是:
Y=mX+b
其中,Y=因变量(如销售)
m=直线的斜率(变量之间的关系)
X=自变量(如雨量)
b=y轴上的截距(直线与竖轴的交叉点)
Lotus1…2…3 计算软件可以求出决定自变量和因变量之间
关系的线性方程。Lotus 软件还能确定这条计算出的“最佳”
的直线能否作为工具准确地预测将来。
冰激凌的回归举例
Ben&Jerry 先生是 20 多家冰淇淋连锁店的老板。他注意
到随着温度的升高或降低,公司的销售额也有相应的变化。
为了确定季节性气候变化和销售额之间准确的数学关系,他
收集了前 5 年每月的销售数据,又从国家气象服务中心查到
对应月份的平均温度。他收集的数据如下:
10 73 600;000
11 45 300;000
12 36 500;000
用 Lotus 计算软件中的数据回归(Data Regression)功
能计算,店主得出如下结果:回归结果
常娄 …379;066
估计的Y值的标准偏差 243;334
R平方 0。704
X系数 16;431
系数的标准偏差 3;367
上列数据的含义是什么?
上面列出的内容包含了描述 Ben&Jerry 公司销售和温度
变化之间关系直线方程的数据。先列出线性方程式:
常数=b=…379;066
X系数=m=16;431
将之代入前面的标准线性方程式中,即:
Y=16;431X…379;066
将数据点在图中画出,并根据方程式绘出这条回归线。
用Lotus计算软件画出的图形如下:
销售Ben&Jerry冰淇淋回归举例
温度°F
如图所示,回归直线从数据点的中间穿过。将温度值 X
代入等式中, 就可以计算出预计的冰淇淋销售量。在Ben&Jerry
的例子中,当温度为 60F°时,估计的月销售额应为 606;794
美元,即
Y=(16431×60F°)…379;066=606;794美元
用这种公式计算出的预计的冰淇淋销售额准确度如何?
对这一问题的答案,可从 Lotus 计算软件中的回归结果
(Regression Output)计算出的另一个数字中找到。
R平方释义
R 平方值告诉我们“用已知的回归方程式解释了数据变化
的百分数”。在这一举例中,回归方程式解释了销售变动的
70。4%。这一比率是很高的。在更为广泛的经济分析中,由于
对经济起影响作用的变动因素很多,所以,能达到30%的 R 平
方值就算是很高的了。在冰淇淋行业,除了天气的变化,所
做的广告,分发的优惠券以及商店营业的时间,都会对销售额的变化有影响。
但是要当心!不要过分指望回归数据的结果!关于温度
变化引起的销售的变化,回归能告诉你的也就这么多。回归
并没说“温度变化确实引起了销售的变支”。但如果选择的
自变量合理,就能得出你想要了解的因变量的值,还是用之
为好。
回归分析不仅能指出诸因素的正面关系,如气温和冰淇
淋的销售的关系,还可以解释负相关因素之间的关系,如利
息和房屋销售的关系。如果利率高,房屋的销售就慢。在这
种情况下,X 系数是负数。这些负相关的作用一如正相关的作
用,都是很有用的。
标准误差释义
Lotus 计算软件得出的“Y 的标准误差和 X 系数”是回归
线Y值标准偏差和 X系数之标准偏差的同义词。在 Ben&Jerry
举例中,估计的Y值(销售)标准误差在68%的情况下是要加、
减243;334 美元。同样得出的结果表明,X 系数(温度)标准
误差是 3367。用标准偏差的方法可以对可能的一组数据进行
各种分析,以确定这些数字的变化以及得出的回归方程式的
可靠性。
可靠性的T型统计测量方法
T 型统计(T Statistic)有助于确定用 Lotus 软件计算
出的回归方程是否能很好地进行预测。T型统计揭示的是 X 变
量对 Y 函数是否在统计上有重大的影响,例如气温对销售的
影响。这一计算方法是将相关系数 X 除以标准误差。大拇指
定律是:如果 T 统计高于 2 或低于…2,变量 X 对函数 Y 就有
统计得到的影响。在我们的举例中。16;431÷3;367=4。88,
具有相当高的 T 型统计值。所以,分析人员就会得出气温对
销售的影响非常明显的结论。
在考虑某一模型能否作为好的预测标准时,需要有一个
较高的 R 平方值和一个较高的 T 型统计值。还可以做出不只
一个 X 变量的模型,叫多重变量回归(Multivariable
regression)。随着变量数量的增加,R 平方也随之增高。但
是,多增加 T 型统计低的变量 X 会造成模型不准确。因此,
有必要人为地增加或减掉独立变量,以达到较高的 R 平方值和较高的T型统