Fst,用于衡量种群分化程度,取值从0到1,为0则认为两个种群间是随机交配的,基因型完全相似;为1则表示是完全隔离的,完全不相似。它往往从基因的多样性来估计,比如SNP或者microsatellites(串联重复序列一种,长度小于等于10bp)。是一种以哈温平衡为前提的种群遗传学统计方法。
下面从一个例子来看如何计算Fst:
| AA | Aa | aa |
种群1 | 125 | 250 | 125 |
种群2 | 50 | 30 | 20 |
种群3 | 100 | 500 | 400 |
表格表示为三个种群中一个等位基因的存在情况。
第一步,计算种群大小:
种群1: 500
种群2: 100
种群3: 1000
第二步,计算等位基因的频率:
p1=(125*2+250)/1000=0.5
q1=1-p1=0.5
p2=(50*2+30)/200=0.65
q2=1-p2=0.35
p3=(100*2+500)/200=0.35
q3=1-p3=0.65
第三步,计算哈温平衡下预期基因型:
种群1: E(AA)=500*0.5*0.5=125(与实际相等)
E(Aa)=500*0.5*0.5*2=250(与实际相等)
E(aa)=500*0.5*0.5=125(与实际相等)
种群2: E(AA)=100*0.65*0.65=42.25(比实际小7.75)
E(Aa)=100*0.65*0.35*2=45.5(比实际多15.5)
E(aa)=100*0.35*0.35=12.25(比实际小7.75)
种群3: E(AA)=1000*0.35*0.35=122.5(比实际多22.5)
E(Aa)=1000*0.35*0.65*2=455(比实际小45)
E(aa)=1000*0.65*0.65=422.5(比实际多22.5)
种群1的 预期=实际,完美适合;
种群2的 预期比实际少15.5个纯合子,也可以理解为实际比预期多15.5个纯合子,可能是近交导致;
种群3的 预期比实际多45个纯合子,也可以理解为实际和预期相比有45个纯合子缺失,可能是远交或Wahlund效应导致。
第四步,计算每个亚群实际观察到的杂合度:
种群1: 250/500=0.5
种群2: 30/100=0.3
种群3: 500/1000=0.5
第五步,计算每个亚群预期的杂合度:
第六步,计算每个亚群的近交系数:
F1=(0.5-0.5)/0.5=0 不近交,不远交
F2=(0.455-0.3)/0.455=0.341 存在近交情况,实际杂合子比预期的少
F3=(0.455-0.5)/0.455=-0.099 存在远交情况,实际杂合子比预期的多
第七步,计算在整个种群中等位基因A的频率:
第八步,计算在整个种群中等位基因a的频率:
第九步,计算三种杂合性指数:
HI(实际杂合度)
HS(亚群预计杂合度--通过每个亚群预计杂合度(亚群等位基因频率)来计算)
HT(种群预计杂合度--通过种群中预计等位基因频率来计算)
第十步,计算: