群体遗传学--Fst指数,即群体间分化指数,用于群体间分化分析。
群体遗传学中衡量群体间分化程度的指标有很多种,最常用的就是Fst指数。Fst指数,由F统计量演变而来。F统计量(F IS,F IT,F ST)主要有三种。Fst是针对一对等位基因,如果基因座上存在复等位基因,则需要用Gst衡量,基因差异分化系数(gene differentiation coefficient,G st)。
k。在一个基因座上,第k个地方群体中第i个等位基因频率为q k(i),杂合体频率观察值为h
k。那么整个群体中观察到的杂合体频率平均值H
I,地方群体为理想群体的期望杂合体频率平均值H
S,整个群体为理想群体的期望杂合体频率H
T,分别为:
IS,是H I相对于H S减少量的比值,即地方群体的平均近交系数。
ST,是H S相对于H T减少量的比值,即有亲缘关系地方群体间的平均近交系数。
S:地方群体为理想群体的期望杂合体频率平均值 H T:整个群体为理想群体的期望杂合体频率
IT,是H I相对于H T减少量的比值,即整个群体的平均近交系数。
可见,三者在数量上的关系为:
ST和F IT分别相当于地方群体和整个群体中携带的一对等位基因是同源的概率,而F ST是从两个地方群体中任意抽取的两个配子是同源的概率。从两个地方群体中任意抽取的两个配子是同源的概率大,表明两个地方群体的遗传组成相似,分化程度低;反义,分化程度高。
ST取值范围[0,1],最大值为1,表明等位基因在各地方群体中固定,完全分化;
最小值为0,意味着不同地方群体遗传结构完全一致,群体间没有分化。
Fst(Fixation index)通常用来衡量population之间的genetic distance。1说明两个population是完全独立的。0说明两个population之间自由interbreeding。Fst值越大,说明genetic distance越远。值越低,说明大多数的genetic variation是发生在同一个population的。
ST为0~0.05:群体间遗传分化很小,可以不考虑;
ST为0.05~0.15,群体间存在中等程度的遗传分化;
ST为0.15~0.25,群体间遗传分化较大;
ST为0.25以上,群体间有很大的遗传分化。
Pi主要用来衡量每个site的nucleotide divergency。
这几个参数同样可以通过vcftools来计算:
vcftools:
--window-pi 3000
--TajimaD 3000