从总体中随机抽取一定量的样本,用样本指标估计总体指标,分为参数统计和非参数统计。

  • 参数统计:在总体分布类型已知的条件下,对其未知参数进行检验的方法。要求独立、正态(方差齐)。如t检验、F检验。
  • 非参数统计:主要采用符号或等级排列(秩排列)来代替数据本身的分析方法。适用于任何分布类型资料的统计分析。如秩和检验。

相关概念:

  • 秩次:观测值由小到大排列后得到的秩序号。当几个数据大小相同时,去平均秩次作为其秩次。
  • 秩和:用秩次代替原始数据求和得到。
  • 秩和检验:用秩和进行假设检验的方法。
1.配对资料符号的秩和检验(Wilcoxon符号秩和检验法)

当配对设计计量资料不具备参数检验的适用条件,可采用符号秩和检验法。其基本思想是:若检验假设成立,则差值的总体分布应是对称的,故正负秩和相差不应悬殊。它是将配对样本差值的中位数与0作比较。
检验步骤:

  1. 建立检验假设
    配对资料符合秩和检验R语言 配对数据秩和检验_中位数:差值的总体中位数等于0,即配对资料符合秩和检验R语言 配对数据秩和检验_中位数_02
    配对资料符合秩和检验R语言 配对数据秩和检验_配对资料符合秩和检验R语言_03:差值的总体中位数不等于0,即配对资料符合秩和检验R语言 配对数据秩和检验_配对资料符合秩和检验R语言_04
    双侧配对资料符合秩和检验R语言 配对数据秩和检验_配对资料符合秩和检验R语言_05
  2. 计算统计量T值
    1)求差值:计算各对数据的差值
    2)编秩:按差值绝对值由小到大编秩。差值为0则舍去不计。
  3. 求秩和并确定统计量T:
    将所有的秩次冠以原差值的符号,分别求出正负差值秩次之和,以配对资料符合秩和检验R语言 配对数据秩和检验_统计学_06表示。双侧配对资料符合秩和检验R语言 配对数据秩和检验_统计学_07表示,单侧任取其一为T。
  4. 确定P值和作出推断结论
    1)查表法配对资料符合秩和检验R语言 配对数据秩和检验_统计学_08:查配对设计用的T界值表,确定P值。n表示差数不为0的对子数,对给定的n值可以得到一个范围,若T在此范围内则接受配对资料符合秩和检验R语言 配对数据秩和检验_中位数,否则接受配对资料符合秩和检验R语言 配对数据秩和检验_配对资料符合秩和检验R语言_03
    2)正态近似法配对资料符合秩和检验R语言 配对数据秩和检验_数据分析_11:可用Z检验,当多次出现相持现象时,求得的Z值偏小,可使用校正公式。
2.单样本资料的符号秩和检验

用于不满足t检验条件的单样本定量变量资料的比较。
目的:推断样本中位数与已知总体中位数是否相等。
检验步骤与1相同,只是求差值计算的是样本数据与已知总体中位数的差。

3.两组样本比较的秩和检验

当两个样本的方差不齐或不服从正态分布时,可采用Wilcoxon符号秩和检验对两个样本的差别作比较。
基本假设:①两个样本分别来自互相独立的两个总体 ②检验假设是两个总体分布相同。
定量变量两独立样本的秩和检验步骤:

  1. 建立检验假设
    配对资料符合秩和检验R语言 配对数据秩和检验_中位数:两组样本的总体分布相同
    配对资料符合秩和检验R语言 配对数据秩和检验_配对资料符合秩和检验R语言_03:两组样本的总体分布不同
    双侧配对资料符合秩和检验R语言 配对数据秩和检验_配对资料符合秩和检验R语言_05
  2. 计算统计量T值
    编秩:将两组数据混合,统一按由小到大编秩,遇到相同数据取平均秩次。
  3. 求秩和并确定统计量T:
    配对资料符合秩和检验R语言 配对数据秩和检验_配对资料符合秩和检验R语言_15表示样本含量较小的那个样本的例数、秩和,以配对资料符合秩和检验R语言 配对数据秩和检验_统计学_16表示样本含量较大的那个样本的例数、秩和。若配对资料符合秩和检验R语言 配对数据秩和检验_中位数_17,则任取一组的秩和为统计量,若配对资料符合秩和检验R语言 配对数据秩和检验_检验步骤_18,则以样本例数较小者对应的秩和为统计量。
  4. 确定P值和作出推断结论
    配对资料符合秩和检验R语言 配对数据秩和检验_检验步骤_19时,查表得到95%的T所在范围。若T在此范围内则接受配对资料符合秩和检验R语言 配对数据秩和检验_中位数,否则接受配对资料符合秩和检验R语言 配对数据秩和检验_配对资料符合秩和检验R语言_03
4.多组样本比较的秩和检验

完全随机设计多组样本比较的非参数方法时Kruskal和Wallis在Wilcoxon秩和检验的基础上发展来的,故又称K-W检验或H检验。
检验目的:推断多组样本分别代表的总体分布是否不同。
基本检验步骤和3相同,只是确定的统计量不同,统计量为:配对资料符合秩和检验R语言 配对数据秩和检验_数据分析_22式中配对资料符合秩和检验R语言 配对数据秩和检验_中位数_23为各组的秩和,配对资料符合秩和检验R语言 配对数据秩和检验_数据分析_24为各组对应的例数,查H界值表可得到P值。

5.基于等级的秩和检验

这类资料的特点是无原始值,只知其所在组段,故应用该组段秩次的平均值作为其秩次,在此基础上计算秩和并进行假设检验,其步骤与两组或多组比较秩和检验相同。需注意的是由于样本含量较多,相同秩次也较多,应用校正后的u值和H值。