Fst,用于衡量种群分化程度,取值从0到1,为0则认为两个种群间是随机交配的,基因型完全相似;为1则表示是完全隔离的,完全不相似。它往往从基因的多样性来估计,比如SNP或者microsatellites(串联重复序列一种,长度小于等于10bp)。是一种以哈温平衡为前提的种群遗传学统计方法。

 

下面从一个例子来看如何计算Fst:

 

 

 

AA

Aa

aa

种群1

125

250

125

种群2

50

30

20

种群3

100

500

400

表格表示为三个种群中一个等位基因的存在情况。

 

第一步,计算种群大小:

种群1: 500

种群2: 100

种群3: 1000

 

第二步,计算等位基因的频率:

p1=(125*2+250)/1000=0.5

q1=1-p1=0.5

 

p2=(50*2+30)/200=0.65

q2=1-p2=0.35

 

p3=(100*2+500)/200=0.35

q3=1-p3=0.65

 

第三步,计算哈温平衡下预期基因型:

种群1: E(AA)=500*0.5*0.5=125(与实际相等)

E(Aa)=500*0.5*0.5*2=250(与实际相等)

E(aa)=500*0.5*0.5=125(与实际相等)

 

种群2: E(AA)=100*0.65*0.65=42.25(比实际小7.75)

E(Aa)=100*0.65*0.35*2=45.5(比实际多15.5)

E(aa)=100*0.35*0.35=12.25(比实际小7.75)

 

种群3: E(AA)=1000*0.35*0.35=122.5(比实际多22.5)

E(Aa)=1000*0.35*0.65*2=455(比实际小45)

E(aa)=1000*0.65*0.65=422.5(比实际多22.5)

 

种群1的 预期=实际,完美适合;

种群2的 预期比实际少15.5个纯合子,也可以理解为实际比预期多15.5个纯合子,可能是近交导致;

种群3的 预期比实际多45个纯合子,也可以理解为实际和预期相比有45个纯合子缺失,可能是远交或Wahlund效应导致。

 

第四步,计算每个亚群实际观察到的杂合度:

种群1: 250/500=0.5

种群2: 30/100=0.3

种群3: 500/1000=0.5

 

第五步,计算每个亚群预期的杂合度:

NSGAII python 种群进化收敛曲线_Fst

 

第六步,计算每个亚群的近交系数:

F1=(0.5-0.5)/0.5=0 不近交,不远交

F2=(0.455-0.3)/0.455=0.341 存在近交情况,实际杂合子比预期的少

F3=(0.455-0.5)/0.455=-0.099 存在远交情况,实际杂合子比预期的多

 

第七步,计算在整个种群中等位基因A的频率:

NSGAII python 种群进化收敛曲线_Fst_02

 

第八步,计算在整个种群中等位基因a的频率:

NSGAII python 种群进化收敛曲线_Fst_03

 

第九步,计算三种杂合性指数:

HI(实际杂合度)

NSGAII python 种群进化收敛曲线_Fst_04

 

HS(亚群预计杂合度--通过每个亚群预计杂合度(亚群等位基因频率)来计算)

NSGAII python 种群进化收敛曲线_遗传平衡_05

 

HT(种群预计杂合度--通过种群中预计等位基因频率来计算)

NSGAII python 种群进化收敛曲线_取值_06

 

第十步,计算:

NSGAII python 种群进化收敛曲线_Fst_07

NSGAII python 种群进化收敛曲线_遗传平衡_08

NSGAII python 种群进化收敛曲线_取值_09