什么是回归

                  从大量的函数结果和自变量反推回函数表达式的过程就是回归。线性回归是利用数理统计中回归分析来确定两种或两种以上变量间相互依赖的定量关系的一种统计分析方法。

 

一元线性回归:

                     只包括一个自变量(回归分析宏 回归分析公式_回归分析)和一个因变量(

回归分析宏 回归分析公式_回归分析_02

),且二者的关系可用一条直线近似表示,这种回归分析称为一元线性回归分析。公式:   

回归分析宏 回归分析公式_权重_03

 

多元线性回归:

                      如果回归分析中包括两个或两个以上的自变量,且因变量和自变量之间是线性关系,则称为多元线性回归分析。

公式:

回归分析宏 回归分析公式_回归分析_04

 

                     对于一元线性回归公式来说,如果给定两组x,y的值,就可以求得和的值。例如:给定两组x,y的值x=3,y=5和x=6,y=8,那么可知如下:

5=回归分析宏 回归分析公式_权重_05+回归分析宏 回归分析公式_回归分析_06*3                 8=回归分析宏 回归分析公式_回归分析宏_07+回归分析宏 回归分析公式_线性回归_08*6

                     可以求得回归分析宏 回归分析公式_回归分析_09=2,回归分析宏 回归分析公式_回归分析_10=1。两点确定一条直线,可以确定和的值。我们可以叫做一元线性回归公式的截距回归分析宏 回归分析公式_回归分析_11可以叫做一元线性回归公式的斜率

 

 

假设某个医院住院人数与医院的床位个数呈线性关系,即:

          住院人数  = 回归分析宏 回归分析公式_权重_12+回归分析宏 回归分析公式_回归分析_13*医院床位数

在这里,如果想求得住院的人数,就要知道回归分析宏 回归分析公式_线性回归_14回归分析宏 回归分析公式_回归分析_15的值,这里的回归分析宏 回归分析公式_回归分析_16回归分析宏 回归分析公式_回归分析_15也叫权重,“医院床位数”可以理解成影响住院人数的一个维度。通过给出两组数据,就可以得到权重的值。

对于一元线性回归来说,如果现在有很多呈线性关系离散的点,假设现在需要找到一个线性回归公式来表示这些点自变量和因变量的关系,每两个点之间都能确定一条直线,如何找到一条直线来表示这些点的关系呢?

 

如何确定这条直线?

每一个离散的点在自变量回归分析宏 回归分析公式_线性回归_18处得到的y的值记为回归分析宏 回归分析公式_回归分析_19,对应的,需要找到的这条直线在自变量回归分析宏 回归分析公式_权重_20处得到的y的值记为

回归分析宏 回归分析公式_回归分析_21

,当所有的回归分析宏 回归分析公式_回归分析_22到对应的

回归分析宏 回归分析公式_回归分析宏_23

的距离差平方累加起来最小,我们就可以认为这条直线比较完美。也就是当平均误差公式:

回归分析宏 回归分析公式_线性回归_24

 最小时这条直线比较完美,其中,

回归分析宏 回归分析公式_回归分析_25代表一系列的真实离散点的y值,

回归分析宏 回归分析公式_权重_26

代表一系列得到的直线在对应的x处的y值,一元线性回归中=

回归分析宏 回归分析公式_线性回归_27


m代表有m个离散点,前面的回归分析宏 回归分析公式_权重_28 是为了方便求导加上的。

 回归分析宏 回归分析公式_线性回归_29表示的是一系列权重

回归分析宏 回归分析公式_权重_30

,,…. 

这个公式也叫做最小二乘法误差公式。error的值如果是0说明确定的这条直线穿过了所有的点,对于离散分散的一组点,error的值不可能为0。