本文目录

协方差

协方差描述变量之间关系

协方差VS相关系数

方差VS协方差

相关系数

相关系数量化相关性的强度

p值及数据量衡量相关系数

Reference


协方差

协方差描述变量之间关系

  • 协方差(Covariance)主要用于描述变量之间的以下三类关系

相关系数图 python 相关系数图片_统计学

正相关关系,例如上图,同一细胞中Gene X表达量与Gene Y表达量成正相关。

相关系数图 python 相关系数图片_数学_02

此时协方差为正。

相关系数图 python 相关系数图片_相关系数图 python_03

负相关关系,例如上图,同一细胞中Gene X表达量与Gene Y表达量成负相关。

相关系数图 python 相关系数图片_相关系数图 python_04

此时协方差为正。 

相关系数图 python 相关系数图片_数学_05

相关系数图 python 相关系数图片_统计学_06


无相关关系,此时Gene X表达量与Gene Y表达量无趋势关系。

相关系数图 python 相关系数图片_生物信息学_07

此时协方差为零。


协方差VS相关系数

  • 协方差(Covariance)另一个作用在于辅助其它统计计算,如相关系数(correlation)。

相关系数图 python 相关系数图片_相关系数图 python_08

如上图,协方差可描述变量的相关性类别(正/负/无相关性),但对数据的取值范围非常敏感,不能用于描述变量之间的相关性程度(若正相关,正相关斜率为多大等);

而相关系数对数据取值范围不敏感,可用来描述变量之间的相关性程度。


方差VS协方差

方差为协方差的一种特殊模式,描述某个变量与本身之间的关系,由下图公式可非常容易理解。

相关系数图 python 相关系数图片_生物信息学_09


相关系数

相关系数图 python 相关系数图片_统计学_10

相关系数计算公式如上图,依赖两变量协方差及各变量的方差,这也回答了上一节所说的协方差辅助计算相关系数。

相关系数量化相关性的强度

弱相关性对应较小的相关系数。

相关系数图 python 相关系数图片_统计学_11

强相关性对应较大的相关系数。

相关系数图 python 相关系数图片_协方差_12

相关系数图 python 相关系数图片_生物信息学_13

相关系数图 python 相关系数图片_统计学_14

相关系数值域在[-1,1]之间,-1表示最强负相关,1表示最强正相关,0表示不相关。

p值及数据量衡量相关系数

相关系数图 python 相关系数图片_生物信息学_15

收集的数据越多,p值越小,推测出的相关系数越可信


Reference