R语言广义线性模型glm()函数
glm(formula, family=family.generator, data,control = list(…))
formula数据关系,如y~x1+x2+x3
family:每一种响应分布(指数分布族)允许各种关联函数将均值和线性预测器关联起来。
常用的family:
binomal(link=’logit’) —-响应变量服从二项分布,连接函数为logit,即logistic回归
binomal(link=’probit’) —-响应变量服从二项分布,连接函数为probit
poisson(link=’identity’) —-响应变量服从泊松分布,即泊松回归
control:控制算法误差和最大迭代次数
glm.control(epsilon = 1e-8, maxit = 25, trace = FALSE)
-----maxit:算法最大迭代次数,改变最大迭代次数:control=list(maxit=100)
源自
实战:
source("setwd.r")
##下面read.csv会出错,因为表头中文乱码,删掉表头,重新定义
Data=read.csv("bankloan.csv")[2:701,]
##查看前几行tail是后几行
head(Data)
colnames(Data)<-c("x1","x2","x3","x4","x5","x6","x7","x8","y")
tail(Data)
#logistic回归模型
glm<-glm(y~x1+x2+x3+x4+x5+x6+x7+x8,family = binomial(link = "logit"),data = Data)
glm
summary(glm)
###逐步寻优法 forward前向选择法backward后向选择法
logit.step<-step(glm,direction = c("both"))
summary(logit.step)