再数据分析的过程中往往需要先创建新变量再进行分析。根据经验,主要包括两方面。

1.独立创建变量,再利用新变量数据进行数据整理和分析,这样比较简单,代码如下:

data$newvar<-data$oldvar

创建一个空白变量代码如下:

data$newvar<-NA

2、新变量是有其他变量转化或者计算得来,代码如下:

由定量变量计算生成新变量:

data$BMI<-data$weight/data$height/data$height*10000

定量或定性变量转化生成新变量:

data<-within({
newvar<-NA
newvar[data$age<18]<-"未成年人"
newvar[data$age>=18]<-"成年人"
})
也可以使用循环语句来实现:
data$newvar<-NA
for(i in 1:length(data$age)){
if data$age[i]<18 data$newvar[i]<-"未成年人"
else data$newvar[i]<-"成年人"
}

需要注意的是,使用循环语句时候,if条件使用的变量(age)不能为空,否则会报错!!!