灵活运用IBM SPSS Statistics做数据的统计和分析是每个数据分析师都应该掌握的技能,这款软件为用户提供了全面的数据分析方法,可以解决我们在数据分析过程中遇到的各种难题。

接下来小编就为大家介绍一下SPSS相关性分析的方法。

spark 算相关系数 spass相关系数怎么求_数据库

图1:SPSS软件启动页

一、概述

相关关系就是现象间不严格的依存关系,即各变量之间不存在确定性的关系,按相关程度从强到弱,有完全相关、不完全相关、不相关之分;按变量之间的相关方向有正相关和负相关之分。

对于大部分分析对象来说,不完全相关的情况比较多。

相关性分析用于描述两个变量之间的密切程度,反映当一个变量被控制时,另一个变量的变化程度。

相关系数的取值范围在-1到1之间,绝对值越大,相关性越强。

二、分析方法

spark 算相关系数 spass相关系数怎么求_ibm_02

图2:相关性分析方法

在“分析”——“相关”列表中,SPSS为用户提供了三种相关性分析的方法,分别是积差相关、偏相关和距离相关。

1.积差相关

spark 算相关系数 spass相关系数怎么求_ibm_03

图3:积差相关

点击“双变量”,可以进入积差分析窗口。

将待分析的变量添加到右侧变量框中,比如说要分析学生的数学成绩和物理成绩有无相关性,就将这两个变量移入变量框中。

spark 算相关系数 spass相关系数怎么求_ibm_04

图4:选项

点击“选项”可设置统计内容和个案排除方法。

设置完成后点击“确定”,就可以开始积差分析了。

此类方法适用于正态分布的成对数据,变量最好是连续的、有线性关系。

2.偏相关

spark 算相关系数 spass相关系数怎么求_ibm_05

图5:偏相关窗口

偏相关分析可以在多个变量中剔除多余影响,仅分析特定两个变量之间的关系。

比如说要分析肺活量与身高的关系,就要排除体重的影响,这时需要将待分析的变量(身高和肺活量)移入上侧的变量框中,将体重移入下侧的控制框中。

这就是使用偏相关分析的基本方法:确认待分析变量,排除其他多余变量。

3.距离分析

当数据中有多个变量,每个变量都含有一定信息,但彼此无法重叠,偏相关的方法就不适用了,可以使用距离分析。

距离分析是一种广义的分类,即在分析过程中将距离小的变量分为一类,将距离大的个案归为其他类,进而为其他更复杂的数据分析打下基础。

spark 算相关系数 spass相关系数怎么求_数据库_06

图6:距离分析

同样以身高、体重、肺活量的检测数据作为案例,如果要分析哪些学生在这三个变量上的取值更为接近,可以使用距离分析。

将身高、体重和肺活量三个变量移入变量框中,下方的个案标注依据可以移入编号,也可以不移入,如果要移入变量,请确定已将其更改为字符串变量,否则无法移入。

spark 算相关系数 spass相关系数怎么求_spark 算相关系数_07

图7:测量设置

选择“个案间”和“相似性”,点击“测量”,选择“区间”中的“皮尔逊相关”,点击“继续”——“确定”,SPSS将为我们完成距离相关性的分析。

三、小结

这里小编整理了三种在IBM SPSS Statistics中进行相关性分析的方法,分别是积差相关分析、偏相关分析和距离相关分析,其中前两者的应用概率更大一点,大家可以着重关注。

希望今天的分享可以对大家有所帮助!