本文介绍了如何在R中运行线性回归。本教程介绍了线性回归的假设以及假设是否违背时的处理方法。它还涵盖了拟合模型和计算模型性能指标以检查线性回归模型的性能。线性回归是最流行的统计技术之一。它已经使用了超过3年。它很容易理解线性回归的输出,因此几乎在每个领域都被广泛接受。

s型曲线回归 r语言 线性回归曲线的r2_拟合

线性回归分布

  线性回归假设目标变量或因变量是正态分布的。正态分布与高斯分布相同。使用高斯族的身份链接功能。

01

标准化系数

当以不同单位表示预测变量(也称为独立变量)时,标准化或标准化系数(也称为估计值)的概念就会浮现。假设您有3个独立变量-年龄,身高和体重。变量“年龄”以年表示,身高以厘米为单位,体重以千克为单位。如果我们需要根据未标准化的系数对这些预测变量进行排名,那将是不公平的比较,因为这些变量的单位不相同。

标准化系数(或估计值)主要用于对预测变量(或自变量或解释变量)进行排名,因为它消除了自变量和因变量的度量单位。我们可以用标准系数的绝对值对独立变量进行排序。最重要的变量将具有标准化系数的最大绝对值。

解释标准系数

标准化系数值1.25表示自变量中一个标准偏差的变化导致因变量中1.25标准偏差增加。

02

解释标准系数

标准化系数值1.25表示自变量中一个标准偏差的变化导致因变量中1.25标准偏差增加。


以下代码涵盖了模型性能的假设测试和评估


1.    资料准备

2.    多重共线性测试

3.    共共线性的处理

4.    检查自相关

5.    检查异常值

6.    检查异方差

7.    残差的正态性检验

8.    前进,后退和逐步选择

9.    计算RMSE

10.   因变量的Box Cox变换

11.   手动计算R平方和Adj,R平方

12.   计算残差和预测值

13.   计算标准系数