1、标准化
对于多元线性回归需要对各个自变量进行标准化,排除单位的影响。
标准化方法:即将原始数据减去相应变量的均数后再除以该变量的标准差,而标准化得到的回归方程称为标准化回归方程,相应得回归系数为标准化回归系数。
2、T检验
T检验是对各个回归系数的检验,绝对值越大,sig就越小,sig代表t检验的显著性,在统计学上,sig<0.05一般被认为是系数检验显著,显著的意思就是你的回归系数的绝对值显著大于0,表明自变量可以有效预测因变量的变异,做出这个结论你有5%的可能会犯错误,即有95%的把握结论正确。
3、F检验
F检验是对所有回归系数的检验,代表你进行回归的所有自变量的回归系数的一个总体检验,如果sig<0.05,说明至少有一个自变量能够有效预测因变量,这个在写数据分析结果时一般可以写出。
F检验和R平方同向变化,当R方=0时F=0;
当R方越大,F值也就越大
当R方=1时,F为无穷大。
F检验是所有回归系数的总显著性的度量也是R方的显著性检验,即检验回归系数为0 等价于R方为0,也就是在计算R方后,就不必做F检验。
另外对于一元线性回归,F检验等价于T检验,因为回归系数只有一个。
4、R方
对于每组数据,我们可以用最小二乘法来求得一个线性模型,但对于这个模型的效果如何,如何来比较模型之间的好坏呢。R方就是来处理这个问题,它可以来计算预测值和真实y值的匹配程度,当R方(0~1)越接近1,这线性关系越明显。
而在使用的时候要用调整后的R方,这个值是针对自变量的增多会不断增强预测力的一个矫正(因为即使没什么用的自变量,只要多增几个,R方也会变大,调整后的R方是对较多自变量的惩罚),R可以不用管,标准化的情况下R也是自变量和因变量的相关