简单相关系数

相关分析是对两个变量间的相关程度进行分析。单相关分析所用的指标称为单相关系数,也就是Pearson相关系数或者相关系数。。通常用 ρ 表示总体的相关系数,以 r 表示样本的相关系数。

R语言和SPSS结果不一致 r与spss_SPSS

相关系数的定义:

R语言和SPSS结果不一致 r与spss_数据_02


简单相关系数的检验

当我们的数据样本容量小的时候,可信程度就比较差。我们需要对他进行检验。也就是对总相关系数 ρ是否等于0进行检验。

计算相关系数r的t值

当X与Y都服从正态分布,并且 ρ=0的条件下,可以使用t检验来确定r的显著性。

R语言和SPSS结果不一致 r与spss_相关分析_03


然后:根据给定的显著性水平和自由度(n-2),,查找t 分布表中相应的临界值 α / 2 t(或 p 值)。若 / 2 | | α t > t (或 p <α )表明r 在统计上是显著的。若 / 2 | | α t ≤ t (或 p ≥α ),

表明 r 在统计上是不显著的。例 5 某地区统计了机电行业的销售额Y 和汽车产量 X(如表 5 所示),请使用 SPSS

计算 Y 与 X 的相关系数并进行显著性检验。

实例

某地区统计了机电行业的销售额Y 和汽车产量 X(如表 5 所示),请使用 SPSS计算 Y 与 X 的相关系数并进行显著性检验。

R语言和SPSS结果不一致 r与spss_R语言和SPSS结果不一致_04


操作步骤如下:

解:(1)根据表 5 的数据创建 SPSS 数据文件。

(2)选择 Analyze=>Correlate=>Bivariate,在显示的对话框中,选择变量 Y 和 X

进入 Variables 框。采用默认设置,直接单击 OK 进行分析。

(3)计算结果如表6所示。

R语言和SPSS结果不一致 r与spss_数据_05


结论分析:从销售额Y与汽车产量的相关系数r=0.901,p=0.000,在α=0.001水平下线性关系显著。

判断显著性标准:若 / 2 | | α t > t (或 p <α )表明r 在统计上是显著的。若 / 2 | | α t ≤ t (或 p ≥α ),表明 r 在统计上是不显著的。

偏相关分析

当要研究的变量是多个的情况下,畜栏里使用简单相关系数之外,还需要计算偏相关系数和复相关系数。

偏相关系数:衡量多个变量之间某两个变量之间的线性相关程度的指标称为偏线性相关。

计算偏相关需要有多个变量的数据,需要将其他变量之间的相互影响考虑进去,也需要控制其他变量单独观察这两个变量之间的关系。

具体操作

依次选择 Analyze=>Correlate=>Partial,再进行相关的操作。