本文目录
协方差
协方差描述变量之间关系
协方差VS相关系数
方差VS协方差
相关系数
相关系数量化相关性的强度
p值及数据量衡量相关系数
Reference
协方差
协方差描述变量之间关系
- 协方差(Covariance)主要用于描述变量之间的以下三类关系:
正相关关系,例如上图,同一细胞中Gene X表达量与Gene Y表达量成正相关。
此时协方差为正。
负相关关系,例如上图,同一细胞中Gene X表达量与Gene Y表达量成负相关。
此时协方差为正。
无相关关系,此时Gene X表达量与Gene Y表达量无趋势关系。
此时协方差为零。
协方差VS相关系数
- 协方差(Covariance)另一个作用在于辅助其它统计计算,如相关系数(correlation)。
如上图,协方差可描述变量的相关性类别(正/负/无相关性),但对数据的取值范围非常敏感,不能用于描述变量之间的相关性程度(若正相关,正相关斜率为多大等);
而相关系数对数据取值范围不敏感,可用来描述变量之间的相关性程度。
方差VS协方差
方差为协方差的一种特殊模式,描述某个变量与本身之间的关系,由下图公式可非常容易理解。
相关系数
相关系数计算公式如上图,依赖两变量协方差及各变量的方差,这也回答了上一节所说的协方差辅助计算相关系数。
相关系数量化相关性的强度
弱相关性对应较小的相关系数。
强相关性对应较大的相关系数。
相关系数值域在[-1,1]之间,-1表示最强负相关,1表示最强正相关,0表示不相关。
p值及数据量衡量相关系数
收集的数据越多,p值越小,推测出的相关系数越可信。