最近在看统计学方面的知识,正好有个学妹问我一些检验方面的东西,以前读书那会的统计学知识早已忘记,经过半天的努力,又把知识给拾起来了,下面简单介绍下T检验和卡方检验。

1.  T检验

适用范围:主要用于样本含量较小(例如n<30),总体标准差σ未知的正态分布。

其中最常用的是单总体t检验,单总体t检验是检验一个样本平均数与一个已知的总体平均数的差异是否显著。

当总体分布是正态分布,如总体标准差未知且样本容量小于30,那么样本平均数与总体平均数的离差统计量呈t分布,即可以考虑使用T检验。

单总体t检验统计量为:




n为样本数。

计算出t值和自由度V=n-1以后,就可以查询界值表,根据是单侧还是双侧假设确定P值,如果P>0.05,则证明假设是对的,如果P<0.05,则证明假设是错的。

步骤:

1.      建立虚无假设H0:μ1 = μ2,即先假定两个总体平均数之间没有显著差异;

2.      计算T值,计算T值有两种方法:

2.1.如果要评断一个总体中的小样本平均数与总体平均值之间的差异程度,其统计量T值的计算公式为:




2.2如果要评断两组独立样本平均数之间的差异程度,其统计量T值的计算公式为:




2.3如果要评判同一样本对不同的处理方法之间的差异程度,其统计量T值的计算公式为:




2.卡方检验

2.1:定义:卡方检验就是统计样本的实际观测值与理论推断值之间的偏离程度,实际观测值与理论推断值之间的偏离程度就决定卡方值的大小,卡方值越大,越不符合;卡方值越小,偏差越小,越趋于符合,若两个值完全相等时,卡方值就为0,表明理论值完全符合。

2.2适用条件:卡方检验适用于分类变量,主要涉及到的是二分类变量的理论值和实际值的检测。

卡方检测主要利用公式计算:




其中A为实际值,也就是实际样本的四格表里的4个数据,T为理论值,也就是理论值四格表里的4个数据。

根据x2的值以及自由度v去界值表去查询,得到P是否是小概率事件来判断理论和实际两者之间的关系,从而判断假设是否正确。。