第四节 结构重组
数据文件的结构有两种:一种是横向结构(变量组结构),一种是纵向结构(个案组结构)。当数据文件的数据结构不符合统计分析的方法要求时就要改变原来的数据结构。
首先打开“数据”-“重构”,原数据如下所示:
其次,将选定变量重构为个案:按照个案组标识(重复的元素)“测量时间”将“ph值”合并为一个新命名的目标变量,固定变量为“测定人”。
可以创建一个综合的索引变量(ph值),创建具有连续类型,“未选择的变量”:保留并作为固定变量处理,“所有转置后的变量中系统缺失值或空值”:废弃数据。最终结果如下所示。
将上述操作的数据恢复过程如下:将选定个案重构为变量:按照个案组标识(重复的元素)“测量时间”,索引变量改为“批次”。
其次,按标识变量和索引变量对当前数据进行排序,最终得到下图。
- 第五节 文件拆分
首先选择菜单“数据”-“拆分为文件”,在弹出的对话框中选择分类变量(如需拆分多个文件,可选多个变量),选择“输出文件指定目录”即可选择输出文件的位置。
单击确定后,在目标目录可以找到如下文件。打开文件后发现文件以“性别”变量为划分依据,分成两个文件。
- 第六节 数据分组
1.按分类变量分组
首先选择菜单“数据”-“拆分文件”,在弹出的对话框中选择“分析所有个案,不创建组”:对全部个案进行分析,不拆分;“比较组”:将各组的输出结果放在一张表里进行比较分析;“按组组织输出”:按组排序输出结果,每组分析单列一张表。
在排序方式中,选择参数“按分组变量进行文件排序”:按分组变量对数据进行排序;“文件已排序”:数据已按分组变量排序。
如果想取消拆分文件的设置,“数据”-“拆分文件”,在弹出的对话框中选择“分析所有个案,不创建组”,此时只取消了拆分文件的设置,不能使顺序还原到拆分之前的设置。
2.按组距分组
(1)重新编码为相同变量
例题:在收集到的原始数据中,居住时间共有几种不同的变量值。为了使分组简化便于统计分析,采用组距分组的方式,将时间分为[0,3] [4,7] [8,+]。
选择“转换”-“重新编码为相同的变量”,选择数字变量,在“旧值和新值”中加入一定范围的变量,在“如果”中选择“包括所有个案”。
- 重新编码为不同变量
选择“转换”-“重新编码为不同的变量”,选择数字变量,在“输出变量”中输入名称,在“标签”中选择“按居住时间分组”。
在“旧值和新值”中,输入相应的变量规则,最后得出结果。