在数据分析中,将连续变量转换为等级变量,或者将分类变量不同的变量等级进行合并是常见的工作。在SPSS中可通过“变量重编码”完成。

变量的重新编码有三种:

(1)用重新编码的变量取代原来的变量,即 重新编码为相同变量

(2)用重新编码的变量生成一个新变量,即 重新编码为不同变量

(3)自动重新编码 功能

重新编码为不同变量

我们以一个实例来看SPSS中如何实现重现编码为不同变量,如何设置各参数?

例:根据 变量 x 的取值范围赋值给新变量:<=1---1,1-2---2, >=2---3

操作步骤:

1) 打开菜单与对话框:转换—重新编码为不同的变量

2) 在下图中,将 x 选入右侧框中

-- 在输出变量下的 名称,输入新的变量名,本例中取 group,在标签中,输入相应的标签,为group.组别

-- 点击“变化量”,在左侧对话框中,显示 x-->group

-- 点击 旧值与新值,弹出相应窗口




python 多分类变量 画图 spss多分类变量处理_SPSS

图 重新编码为不同变量



3) 旧值与新值 对话框,参数说明

旧值

值:原观察值的取值

范围:观察值范围,从n1到n2

范围(从最低到值):从最小值到n2

范围(从值到最高):从值n1到最大值

新值:

值:新变量取值

旧—新:

观察值与新变量的对应关系设置后点击“添加”将其添加到下面的框内,可通过 Change 或 Remove 改变或取消关系。

在本例中,按照规则设置如下:




python 多分类变量 画图 spss多分类变量处理_赋值_02

图 重新编码--旧值与新值



点击 确定,回到数据视图中,就会看到生成一个新变量。




python 多分类变量 画图 spss多分类变量处理_SPSS_03

图 3 结果



语法:

RECODE x (Lowest thru 1=1) (1.001 thru 2.0=2) (2.0001 thru Highest=3) INTO group. VARIABLE LABELS  group 'group.组别'. EXECUTE.

注意1:

大家一定觉得奇怪,在指定数据范围的时,为什么会有小数,而不是整数?

答:这注意因为在SPSS的赋值窗口中,范围是包含等于的,若范围输入1和2,则代表 1<=x<=2。若最低到某值,输入1,则代表 x<=1;若某值到最高,输入2,则代表 x>=2。所以会通过增加小数点进行分割。

注意2:

前面也谈到,在SPSS中,还有一个选项为“重新编码到相同变量”,因为相同编码会把原始数据覆盖,而且不可恢复,如果没有备份,可能会造成很大的影响。所以不建议大家使用。

自动重新编码

自动重新编码主要用于将字符型变量进行数值化,并且给予“值标签”编码,这是非常实用的功能啊!

例:根据 变量 性别 的取值重新编码

操作步骤:

1) 打开菜单与对话框:转换—自动编码

2) 在下图中,将 性别 选入右侧框中

-- 新名称:代表重新编码后的新变量

-- 点击新名称,则呈现到上方对话框中

-- 点击确定,即可




python 多分类变量 画图 spss多分类变量处理_SPSS_04

图 自动编码对话框




python 多分类变量 画图 spss多分类变量处理_SPSS_05

图 自动编码数据视图




python 多分类变量 画图 spss多分类变量处理_取值_06

图 结果显示中,会显示编码对应的名称



语法:

AUTORECODE VARIABLES=性别   /INTO gender   /PRINT.