爱爱小说网 > 其他电子书 > 普通遗传学 >

第31章

普通遗传学-第31章

小说: 普通遗传学 字数: 每页3500字

按键盘上方向键 ← 或 → 可快速上下翻页,按键盘上的 Enter 键可回到本书目录页,按键盘上方向键 ↑ 可回到本页顶部!
————未阅读完?加入书签已便下次继续阅读!



的频率所构成的分布,称频率分布(frequency distribution)。频率分布同样可用图示表示。上节的图10…1、图10…2均显示了性状的频率分布情况。
由次数分布或频率分布可以看到变量分布的两种明显特点,即集中性和离散性。其中平均数(arithmetic mean)是反映集中性的参数,它是某一性状的许多观察值的算术平均。可用公式表示为:
x0=∑xi/n;(i=1;2;…,n)
x0为平均值(或均值),xi为性状的每一个观察值(或变量),n为观察值的总个数或变量数,∑表示求和。
也可利用变量的频率计算平均值,即加权平均数,表达如下式:
x0=∑fixi
fi为某一观察值出现的频率。
反映离散性的参数一般是方差(variance)或标准差(standard deviation)方差是变量与平均数离差的平方和,标准差是方差开平方根植。两者均表示一组变量离开平均数的变异程度。方差越大,各观察值(变数)与平均数间的偏差就越大,反之,观察值与平均数间的偏差就小。总体方差是以变量与平均数间的偏差的平均平方之和来表示,记为O2。通常总体方差是通过样品方差S2来估计的。样品方差用公式表示为:
S2=∑(X2…XO)2/(n…1)='∑x2i…(∑(x2))2/n'/(n…1)
n为观察值的样本数。
另外,生物统计可以用相关系数和协方差等统计参数描述两组或多组遗传上相关的变量之间的相互关系。相关系数(correlation coefficient)是度量两组变量协同变化程度的统计量。将观察到的成对数据按下式可以计算得到相关系数。
rxy=∑(x…x0)(y…y0)/SQR'∑(x…x0)2∑(y…y0)2'
这里x;y为两个变数,x0;y0表示平均数,SQR为平方根。
而乘积和平均,记为协方差(covariance),它反映的也是两组变量协同变化程度或上下代间的依存关系,相关系数与协方差的关系用下式表示:
rxy=COVx。y/sxsy
这里COVx。y=∑(x…x0)(y…y0)/n。
由此可以认为,相关系数是标准化了的协方差。当然,遗传分析中的子代与亲代间的依存关系,也可以用回归系数来描叙。简单的直线回归系数byx表述是以x为自变量,y随着x的一个单位增加(或减少)所改变的单位数。其它义式为:
byx=∑(x…x0)(y…y0)/∑(x…x0)2
现以上述East的烟草花冠长度的遗传研究数据为例,说明数量性状的表型分布特点。表10…1是烟草不同世代单株的花冠长度的数据,经整理后的次数分布表。该表次数分布数据以图形表示就成为了图10…2。根据表中的观察数据,可以容易计算出平均数和方差等参数,如针对亲本P1,观测了49个单株个体一的花冠长度,得到1个观察数在34mm组间内,4个在37mm组间内,18个在40mm左右,16个为43mm,10个落在46mm组间。所以,其加权平均数为(1×34+4×37+18×40+16×43+10×46)/49=41。8,方差为8。56,标准差为2。92;同样其他群体的平均值、方差和标准差也可以获得(见表10…1下三行)。
表10…1  不同世代的花冠长度数据整理为次数分布及参数估计情况
组中点值/mm P1 P2 F1 F2
34 1
37 4
40 18
43 16
46 10
49
52 2
55 4 4
58 10 2
61 41 24
64 75 37
67 40 31
70 3 38
73 35
76 27
79 21
82 5
85 6
88 2 1
91 16
94 32
97 6
100 1
N 49 57 173 233
X0   41。8   93。4    63。5     69。8
S2     8。56     4。97      8。57      46。10
s     2。92     2。23      2。92       6。79

表10…1可以看到,即使是基因型纯合的亲本,每个个体的观察值也是不样的,这种变异明显属于非遗传因素引起的环境变异,其方差的大小反映了该变异的大小。同样可以看到F2代方差比F1代方差及双亲都大,反映出F2代中基因重组分离引起的变异较大。而这种连续分布的变异(幅度)可以直观地在图10…2显示出来。
10。2。2  基因型与表型分布
以控制某一性状的基因对数不同的F2群体的表型分开布为例,如果性状受一对或少数几对基因控制,表现为典型的质量性状,则分组方柱图明显(图10…1),每组基因型与表现型有较好的对应关系;尽管如此,若受非遗传因素的较大影响,不同基因型间的表现会存在相互交错的情况,性状表现的柱形图也会近似于连续性的分布图形;当性状受多对基因控制,许多基因间的差异会减少,加上环境因素的作用,性状表型将呈现连续变异的正太分布,表现出典型的数量性状特征(图10…2),这时从表型的结果推断其基因型会有相当大的困难。正态分布的一个主要特点就是群体中任何个体基因型出现的频率均可用正态分布的密度函数给出,而该密度函数完全决定于该群体的平均数和标准差。换言之,由于数量性状的表型一般呈正态分布,因此,知道了性状在群体中的平均表现和标准差,就可以知道每个个体性状的表型特点。
另外,在众多的生物性状中,有一类特殊的性状,其遗传基础是多基因控制的,但其表现呈非连续性变异,如与动物和人类的患病与健康等相关的性状。一般认为这类性状具有一个潜在的连续型变量分布,以连续分布上的一点(阈值)为界,其表型是间断或不连续的。如人体的易患性,其变异是连续的,但当一个个体易患性达到一定程度(阈值),该个体表现为患病。在一定条件下,阈值标志着患病所必需的最少基因数目的表达。
10。3  数量性状分析的遗传模型
一个数量性状的表型值就是所度量或观察到的数值。可以理解,这个表型值是遗传与环境共同作用的结果。所以,性状的表型值理论上可以剖分为遗传和环境两个组成部分,用数学符号表示为:
P=G+E
其中P为性状的表型值,G为基因型值,E为环境效应。
在一个群体内,环境对个体(基因型)的影响使得个体的表型值偏离基因型值,但由于环境作用效应的方向(如正负值)是随机的,所以就许多个体的平均而言,环境效应等于零,即群体的平均表型值实际上就等于基因型值。
由于基因型反映的是不同位点上等位基因的组成状况。因此,基因型值也可根据基因的组成进一步剖分为:基因的加性效应(additive effect;简写为A)和基因的显性效应或显性离差(dominance effect;D)以及互作效应或上位性(interaction effect;I)。用式子表示为:
G=A+D+I
综合前述的表型值公式,则任何性状的观察值(表型值)可简单地用下列表示:P=A+D+I+E
若忽略基因与环境的互作效应,则
P=A+D+E
它就是数量性状平均数的加性…显性遗传模型。
10。3。1  群体基因型值的平均数
理论上,每个基因型的基因型值可以根据位点上基因的组成计算出来。考虑一个位点上有两个等位基因(如A;a)的情况,在群体中该位点可能存在3种基因型(AA;Aa;aa)其中一种纯合子(AA)的基因型值赋为a;另一种纯合子(aa),的基因型值赋为—a,杂合子基因型值指定d,假定A对性状有增效作用,a对性状有减效作用(注这里的大小写不是通常表示的基因显隐性),则各种基因型如图10…3所示。
基因型

基因型值
图10…3 一个位点一对等位基因的加性…显性效应模型
以两纯合子(亲本)基因型值的平均值(中亲值,记为m)为零,以此为度量点,三种基因型值可认为是距离中亲值的离差,a是基因加性效应与中亲值的离差理论值,d为由基因的显性效应引起的与中亲值的离差。d值大小决定于基因显性程度,若无显性存在,d=0;A对a为显性,d》0;若显性是完全的,则d=a;反之,a对A为显性,则da。
现在考虑群体中各等位基因的频率以及基因型率对基因型均值的影响。假定在一个随机交配的平衡群体中,一对等位基因(A,a)的频率为p和q,则在一个随机交配群体中,群体的平均基因型值计算如表10…2:
表10…2  一个随机交配群体中群体的平均基因型值及频率
基因型 基因型值 频率 频率×基因型值 基因型 基因型值 频率 频率×基因型值
AA a P2 P2a aa …a q2 …q2a
Aa d 2pq 2pq。d 总和 1 P2a+2pqd…q2a
即群体基因型值的平均数(均值)为:
u=(p2a+2pqd…q2a)/(p2+2pq+p2)=(p2a+2pqd…q2a)=(p2…q2)a+2pqd
 =(p+q)(p…q)+2pqd=(p…q)a+2qpd  ( 注意p+q=1)
由上式可知,基因型均值由两部分组成:纯合体效应(p…q)a和杂合体效应2pqd。两部分的大小均与基因频率有关。例如无显性存在,即d=0,则u=(p…q)a=(1…2q)a,基因型均值正好等于群体的基因型频率;若p=q=1/2,则该群体的基因型均值等于1/2d。
以上是以一个位点两对等位基因为例的群体平均数大小,当有n个基因位点作用于同一性状时,假定各基因效应是线性可加的,且忽略非等位基因间的互作,则群体的基因型均值应为:
u=∑(p…q)a+2pqd
10。3。2  群体的方差
若数量性状用简单通式P=G+E表示,则在群体中,可用方差分析将表型变异(方差)剖分为遗传方差和环境方差,即VP=VG+VE,式中VP为表型方差,VG为基因型方差,VE为环境方差。其推导如下:
当P=G+E时:
∑(P…P0)2=∑'(G+E)…(G0+E0)'2=∑(G…G0)2+
∑(E…E0)2+2∑(G…G0)(E…E0)
这里P0,G0,E0分别代表表型、基因型与环境的均值;
各项除以n得:
∑(P…P0)2/n=∑(G…G0)2/n+∑(E…E0)2/n+2∑(G…G0)(E…E0)/n
很显然VP=∑((P…P0)2/n,VG=∑(G…G0)2/n,VE=∑(E…E0)2/n,而COVG;E=∑(G…G0) (E…E0)/n,若G,E不相关,则COVG。E为零,于是:
VP=VG+VE
由于G=A+D+I,同样VG可以进一步分解为加性方差(VA)、显性方差(VD)和上位性方差(V1)等。
分解各种方差分量通常会采用不同的遗传交配设计,即设计亲本间或亲本与子代间的杂交方式,得到不同遗传分离群体,通过对不同世代群体的方差分析,估计出遗传、环境等不同变异的分量。当然,常用的遗传交配设计应该是易于作统计分析,方差成分易于作遗传解释的一些类型,如双亲本杂交设计、双因素遗传设计、回交系统设计以及双列杂交设计等。双亲本杂交类型中的世代群体主要包括纯合体亲本P1、P2以及它们的杂种F1,F1自交得到的F2,以及由F2衍生的许多分离群体如F3,重组自交系(RIL)等。其中,由于纯合体亲和F1为不分离世代,每个群体中个体间的基因型是相同的,理论上个体间无遣传差异,所表现出的差异应该是环境因素引起的。因此不分离世代的基因型方差为零,表型方差等于环境方差。下面就常见的几种分离群体的方差组成作介绍。
10。3。2。1  F2代的方差
根据加性…显性模型,F2群体的遗传方差是由于基因的分离与重组引起的,它又可分为基因的加性效应与显性效应引起的加性方差与显性方差,即群体的基因型方差为加性方差与显性方差之和。若考虑一个位点一对等位基因(A,a)的情况,则F2群体的遗传组成是1/4AA+1/2Aa+1/4aa,基因型前的系数是各基因型的频率,基总的基因型方差应该为各基因型值与群体总平均的离差平方和的加权平均值。根据表10…2可能推导出,群体的总平均为1/2d,基因型方差为:
VG=1/4(a…1/2d)2+1/2(d…1/2d)2+1/4(…a…1/2d)2=1/2a2+1/4d2
若控制性状有k对基因差异,假定这些基因无上位性和连锁,则F2群体的总基因型方差可表示为:
VG=1/2∑a2+1/4∑d2
令VA=∑a2,VD=∑d2,
则VG=1/2VA+1/4VD,
加上环境方差,F2群体的表型方差为:
=1/2VA+1/4VD+VE,
即F2群体的方差由加性方差(1/2VA)、显性方差(1/4VD)和环境方差(VE)组成。
10。3。2。2  回交世代的方差
对于一对等位基因(A;a)而言,杂种F1与双亲杂交产生两个回交世代,其遗传组成为:
B1=F1×P1=Aa×AA1/2AA+1/2Aa
B2=F1×P2=Aa×aa1/2aa+1/2Aa
两个回交世代的基因型平均值分别为:
B1=1/2a+1/2d
B2=…1/2a=1/2d
两个回交世代的基因型方差分别为:
VG()=1/4a2+1/4d2…1/2ad
VG(B2)=1/4a2+1/4d2+1/2ad
将上述两个方差相加,可得到:
VG(B1)+VG(B2)=1/2a2+1/2d2
同样假定存在多个基因的差异,它们间无连锁和上位性,则两个回交世代的基因型方差之和:
VG(B1)+VG(B2)=1/2VA+1/2VD
考虑到环境方差,则回交一代的平均型方差可写成:
1/2(VB1+VB2)=1/4VA+1/4VD+VE
10。3。2。3  F3世代的方差
从F2代继续自交,可以得到F3世代及其他衍生群体。同样以一对等位基因A…a为例,F3世代群体的遗传组成 是3/8AA+1/4Aa+3/8aa,其平均数是1/4d。
F3群体的部基因型方差为VF3=3/4a2+3/16d2。这个方差可分解为两个部分:
1.F3家系平均数的方差(V1F3),在F3群体中,基因型为AA和aa的F2个体所产生的F3家系,必然完全各为AA和aa,而杂合子Aa的F2个体所产生的F3家系将重复F2代的分离。因此在F3群体内,三种基型(AA,Aa,aa)家系的平均基因型值应为a,1/2d,…a,其基因型频率为1/4,1/2和1/4,而F3群体平均数为1/4d;由此计算出F3家系平均的方差如下:
2.F3各家系的方差的平均(V2F3),即在F3群体内各个家系计求其个别的方差,然后将这些方差平均。具体而言,凡AA和aa的F2个体所产生的F3家系,其家系内遗传差为零,而杂合子Aa的F2个体所产生的F3家系其方差应和应和F2代的方差一样,等于1/2a2+1/4d2。现考虑F3群体这些家系的频率,就会得到F3群体内各家系方差的平均为:
1/4(0)+1/2(1/2a2+1/4d2)+1/4(0)=1/4a2+1/8d2
在多基因的情况下,有上述同样的假定,则F3群体的总基因型方差可写为:
VF3=3/4VA+1/16VD
分解的两部分方差为:
家系平均数的方差V1F3=1/2VA+1/16VD
家系的方差的平均V2F3=1/4VA+1/8VD
若加上不能遗传的变异则以上两个方差可写成:
V1F3=1/2VA+1/16VD+E2
V2F3=1/4VA+1/8VD+E1
这里的两个非遗传方差并不相等,E1是由家系内非遗传变异引起的,而E2则主要包含家系间的非遗传变异。
如果同时考虑F2及F3群体,则可以估算F2个体表现与其衍生的F3家系平均值间的协方差(COVF2。3),并研究亲子间的相关性。现以表10…3为例,估计F2代个体与其相应的F3子代家系的协方差。
表10…3  F2亲代个体与其相应的F3子代家系的基因型值
F2代基因型 基因型值 F3代平均值 F3代基因型频率
AA a a 1/4
Aa d 1/2d 1/2
aa …a …a 1/4
总 1/2d 1/4d 1
其中F2亲代群体的平均值为1/2d,F3子代群体的平均为1/4d,因此
COVF2。3=1/4(a…1/2d)(1/2d…1/4d)+(a…1/4d)+1/2(d…1/2d)
1/4(…a…1/2d)(…a…1/4d)
=1/2a2+1/8d2
若有多对基因的差异,按前述同样的假定,则COVF2。3=1/2VA+1/8VD
这里需要特别指出的是,在亲子代间环境因素不相关的条件下,协方差中无环境分量。在植物遗传实验中,将F2个体和F3 家系按随机区组试验设计种植

返回目录 上一页 下一页 回到顶部 0 0

你可能喜欢的