t-test 也称为 Student's T Test,用来比较两样本平均值之间是否具有显著性差异

T-test的类型:

  • one-sample t-test,用来比较单个样本平均值和一个给定的平均值(理论值);
  • independent samples t-test( unpaired two samples t-est),用来比较两组独立样本平均值;
  • paired t-test,用来比较两个相关样本组之间的平均值;

t-value:

t-value 就是组间差异与组内差异的比值。

testng 读取excel test数据_数据分析

上面就是两组样本均值的差值; 下面是standard error of the difference,均值差的标准误(均值标准误的差)。 

关于SE的解释如下[1]

testng 读取excel test数据_数据分析_02

 1、单样本T检验(one-sample t-test)

testng 读取excel test数据_数据分析_03

 testng 读取excel test数据_T-test_04是样本的均值,testng 读取excel test数据_testng 读取excel_05是一个已知的均值(理论值),s是样本的标准差(standard deviation),n是样本量。

 2、独立样本T检验

 独立样本 T 检验,首先要服从正态分布。根据两组数据的方差是否相同,分为 pooled variances 和 separate variances。

  • 同方差(pooled variances)t-test

testng 读取excel test数据_testng 读取excel_06

A 和 B 代表两组要比较的数据; 

MA 是A 组数据的均值;MB是B 组数据的均值;

testng 读取excel test数据_testng 读取excel_07

是 A 和 B 两组数据共同方差的估计值:

testng 读取excel test数据_数据_08

  • 异方差(separate variance)t-test

testng 读取excel test数据_testng 读取excel_09

 

testng 读取excel test数据_testng 读取excel_10

是A 组数据的方差;方差的计算方法如下:

testng 读取excel test数据_数据_11

 3、配对样本 T 检验(paired t-test)

如果对相同的人或事,有两个测量值(before/after)选择配对 T 检验。

 要比较配对样本的均值,首先要计算出所有配对的差值 d,下面两个公式是等价的。

testng 读取excel test数据_方差_12

testng 读取excel test数据_testng 读取excel_13

 

什么是T-检验:

经t检验将告诉您如何显著群体之间的差异; 换句话说,它让您知道这些差异(以均值衡量)是否可能是偶然发生的。

 何时选用配对样本T-检验:

如果您对同一项目、人或事物有两个测量值,请选择配对 t 检验。如果您有两个以独特条件进行测量的项目,您也应该选择此测试。例如,您可能在车辆研究和测试中测量汽车安全性能,并对汽车进行一系列碰撞测试。尽管制造商不同,但您可能会遇到相同的条件。

关于P值[3]:

P<5%表明小于5%的数据是随机的,而大于95%是significant的。同理P>5%的时候,数据的真实可信度是低于95%的。

 手动配对样本 T 检验(样例):

示例问题:手动计算以下数据的配对 t 检验:

testng 读取excel test数据_方差_14

步骤 1:从每个 X 分数中减去每个 Y 分数。 

testng 读取excel test数据_T-test_15

第 2 步:将第 1 步中的所有值相加。暂时将此数字放在一边。

testng 读取excel test数据_数据分析_16

第 3 步:将与第 1 步的差异平方。

testng 读取excel test数据_testng 读取excel_17

第 4 步:将第 3 步的所有平方差加起来。

testng 读取excel test数据_testng 读取excel_18

步骤 5:使用以下公式计算 t-score:

testng 读取excel test数据_数据_19

  • ΣD:差值总和(步骤 2 中 XY 的总和)
  • ΣD 2:平方差之和(来自步骤 4)
  • (ΣD) 2:差异的总和(来自步骤 2),平方

testng 读取excel test数据_数据分析_20

 t=-2.74

步骤 6:从样本量中减去 1得到自由度。我们有 11 个项目,所以 11-1 = 10。

步骤7:查找p值在 t-table,使用该自由度在步骤6中如果不具有指定的α水平,使用0.05(5%)。对于此示例问题,当 df = 10 时,t 值为 2.228。

步骤 8:将步骤 7 中的 t 表值 (2.228) 与计算的 t 值 (-2.74) 进行比较。在 0.05 的 alpha 水平下,计算的 t 值大于表中的值。p 值小于 alpha 水平:p <.05。我们可以拒绝均值之间没有差异的原假设