一、问题与数据

研究者想验证一种新型运动饮料配方是否有助于提高人们的跑步距离。传统饮料配方为纯碳水化合物,而新型饮料为碳水化合物-蛋白质混合物。

 

为了比较两种运动饮料对人们跑步距离的影响差异,研究者招募了20名受试者,每人进行2项试验,每项试验受试者均在跑步机上运动2小时。2项试验中,同一受试者跑步前分别喝含纯碳水化合物饮料和碳水化合物-蛋白质混合饮料。同时,均衡所有受试者进行2项试验的先后顺序,使一半人先喝纯碳水化合物饮料,另一半人先喝碳水化合物-蛋白质混合饮料,分别记录其跑步距离。

 

碳水化合物饮料组的跑步距离记为carb变量,碳水化合物-蛋白质饮料组的跑步距离记为carb_protein变量。研究者想知道,是否2组的跑步距离有差异,即2种运动饮料对人们跑步距离的影响不同。从变量层面上,也就是看是否carb变量和carb_protein变量的均数存在差异(部分数据如下图)。

 

 

深度学习样本数量匹配 样本配对_数据

 

 

二、对问题的分析

 

研究者想探索是否2个相关(配对)组别间的因变量均数存在差异,可以使用配对样本t检验。使用配对样本t检验时,需要考虑4个假设:

 

假设1:因变量为连续变量;

假设2:自变量包含2个分类、且相关(配对)非独立的组别;

假设3:2个相关(配对)组别间的因变量差值没有明显异常值;

假设4:2个相关(配对)组别间的因变量差值近似服从正态分布。

 

那么进行配对样本t检验时,如何考虑和处理这4个假设呢?

 

三、思维导图

 

深度学习样本数量匹配 样本配对_SPSS教程_02

 

 

 

四、对假设的判断

 

假设1:因变量为连续变量;假设2:自变量包含2个分类、且相关(配对)非独立的组别。和研究设计有关,需要根据实际情况进行判断

 

假设3:2个相关(配对)组别间的因变量差值没有明显异常值。

 

对于配对样本t检验,异常值和正态性的假设检验都是基于2组间配对数值的差值进行的。因此,我们首先需要计算2组因变量的差值,并把它作为一个新变量储存,变量名为difference,具体操作如下: