检验问题可划分为两大类:参数检验和非参数检验,其中总体分布的具体函数形式的前提下,只是其中若干个参数未知称为参数检验,否则称为非参数检验。
一、研究场景
非参数检验用于研究定类数据与定量数据之间的关系情况。例如研究人员想知道不同性别学生的购买意愿是否有显著差异。如果购买意愿呈现出正态性,则建议使用方差分析,如果购买意愿没有呈现出正态性特质,此时建议可使用非参数检验。
二、非参数检验方法类型
SPSSAU整理
对于不同的样本形式所使用的非参数检验方法不同,以及使用参数检验时对应方法参考下表:
非参数检验还有很多,比如卡方检验、游程检验等。本篇文章以Kruskal-Wallis检验为例分析。
补充说明:如果X的组别为两组,比如男和女共两组,则应该使用MannWhitney统计量,如果组别超过两组,则应该使用Kruskal-Wallis统计量结果。SPSSAU自动为你选择MannWhitney或者Kruskal-Wallis统计量。
三、SPSSAU操作
1.SPSSAU上传数据
登录账号后进入SPSSAU页面,点击右上角“上传数据”,将处理好的数据进行“点击上传文件”上传即可。
2.拖拽分析项
点击通用方法里的“非参数检验”将分析项拖拽到右侧分析框后点击“开始分析”按钮。
3.选择参数
四、Kruskal一Wallis检验分析
背景:研究不同文化程度的人群对“淘宝客服服务态度”,“淘宝商家服务质量”这两项的差异性(此案例仅针对该文章使用)。
1.非参数检验分析结果
从上表可知,利用非参数检验去研究学历对于淘宝客服服务态度, 淘宝商家服务质量共2项的差异性,从上表可以看出:学历超过两组组成,因而使用Kruskal-Wallis检验统计量进行分析。
不同学历样本对于淘宝客服服务态度共1项不会表现出显著性(p>0.05) ,意味着不同学历样本对于淘宝客服服务态度全部均表现出一致性,并没有差异性。
另外学历样本对于淘宝商家服务质量共1项呈现出显著性(p<0.05),意味着不同学历样本对于淘宝商家服务质量有着差异性。
2.箱线图分析
“蓝色”代表淘宝客服服务态度,“桔色”代表淘宝商家服务质量。可通过对比箱线图可以明显的看出不同学历样本对于淘宝客服服务态度共1项不会表现出显著性差异,另外学历样本对于淘宝商家服务质量共1项呈现出显著性差异。
3.Nemenyi法两两比较结果
首先满足非参数Kruskal-Wallis检验时呈现出显著性(p<0.05),才能进一步进行事后检验;由非参数检验分析结果可以得到不同学历样本对于淘宝商家服务质量共1项呈现出显著性,根据Nemenyi法两两比较结果可以看出:高中与专科、高中与本科、专科与本科之间进行比较p值均<0.05,所以两两比较结果均具有显著性差异,以及表格还提供了中位数、差值等。
4.非参数检验分析结果(简化格式)
(1)横向
简化后的格式没有提供25%和75%分位数,但是提供了关键指标:统计量以及p值等。
(2)纵向
上表所展示的是非参数分析结果的纵向格式与简化横向格式相比,输出指标相同只是表达方式一个横向、一个纵向。
五、其它问题
1. 提示‘数据质量异常’如何解决?
如果是X的某个组别下,Y的个数小于2个,此时会出现异常情况。建议使用分类汇总进行检查,确认此种异常情况后,使用筛选样本功能处理后再次分析即可。
2.事后比较时:Nemenyi,Dunn’s t 检验和Dunn’s t 检验(校正p 值)如何选择?
实际研究中,Dunn’t t 检验使用较多,Dunn’s t 检验(校正p 值)的检验效能较低非常保守(尤其是组别较多时),不建议使用。建议研究者参考文献进行选择即可。
3.P25,P75是什么意思?
非参数检验时SPSSAU默认输出中位数,25%和75%分位数,同时建议结合箱线图对比数据分布的差异性情况等。
六、总结
以上就是非参数检验的分析步骤,其他方法也是一样的,事实上在大部分研究中,如果可以使用参数检验,即使不满足正态分布,也优先选择参数检验,尤其是在样本量较大的情况下。