目录
一、lm函数建立线性回归模型
(1)一元线性回归
(2)多元线性回归
二、lm函数建立非线性回归模型
三、回归诊断
一、lm函数建立线性回归模型
(1)一元线性回归
1.首先加载R语言的MASS、ISLR2程序包,然后加载数据集Boston。
install.packages("ISLR2")
library(ISLR2)
library(MASS)
head(Boston)
2.接着,利用lm函数进行回归分析,并用回归拟合的函数进行预测。 系数均通过t检验,因此拟合的函数为 y=-0.95005x+34.55384。
lm.fit <- lm(medv~lstat, data = Boston)#回归拟合
summary(lm.fit)#展示回归函数的信息
coef(lm.fit)# 相关系数
confint(lm.fit)# 置信区间
predict(lm.fit, data.frame(lstat = c(5,10,15)), interval = 'prediction')#预测
3.做数据集中medv和lstat的散点图,并画出拟合直线。其中plot函数中pch为符号命令,可自行修改。然后绘制拟合曲线的残差图,包括标准化残差图、QQ图等。
attach(Boston)
plot(lstat, medv)#绘制散点图
abline(lm.fit)#添加拟合直线
plot(lstat, medv, pch = 25)##pch用于修改符号表示vc
par(mfrow=c(2,2))
plot(lm.fit)#绘制回归曲线的图
which.max(hatvalues(lm.fit))#标识向量中最大元素的索引
4.注意在函数后添加-1与+1的区别:添加-1意味着拟合函数中不含常数项,+1与不添加后缀均为含常数项的含义。
fit<-lm(medv~lstat-1,data=Boston)
summary(fit)
summary(lm.fit)
(2)多元线性回归
同样,利用lm函数进行多元线性回归,自行选择自变量的个数。
#多元线性回归
mfit <- lm(medv~lstat + age)
summary(mfit)
lm.fit <- lm(medv ~ ., data = Boston)#因变量为除medv外的其余变量
summary(lm.fit)
install.packages("car")
library(car)
vif(lm.fit)##计算方差膨胀系数
summary(lm(medv ~ lstat * age, data = Boston))#交互项
二、lm函数建立非线性回归模型
利用lm函数进行非线性回归,如高阶多项式拟合、对数拟合等。
#非线性回归
lm.fit2 <- lm(medv ~ lstat + I(lstat^2))
summary(lm.fit2)
# 通过方差分析比较两个模型的好坏
lm.fit <- lm(medv ~ lstat)
anova(lm.fit, lm.fit2)
#绘制lm.fit2回归函数的图
par(mfrow = c(2, 2))
plot(lm.fit2)
#高阶多项式拟合
mfit5 <- lm(medv ~ poly(lstat, 5))
summary(mfit5)
# 取对数变换
logfit<-lm(medv ~ log(rm), data = Boston)
summary(logfit)
三、回归诊断
y<-residuals(lm.fit)#计算残差
y2<-rstandard(lm.fit)#计算标准化残差
shapiro.test(y)#检验残差的正态性
y1<-predict(lm.fit)#将原始数据带入拟合函数进行预测
plot(y2~y1,ylab="残差")#绘制
abline(h=2)
abline(h=-2)##若点分布在[-2,2]内,且不呈趋势,则残差近似满足正态性,模型合适
另加:利用逐步回归进行选取变量,根据AIC统计量最小的原则。
lm.new<-step(lm.fit)#做逐步回归,选择AIC最小的函数
summary(lm.new)
influence.measures(lm.fit)#检测有问题的样本
以上就是本文的全部内容,如有错误,欢迎大家批评指正。