线性回归F值线性回归f值是什么

转载

我心依旧 2024-05-26 18:00:50

文章标签 线性回归F值线性回归最小二乘法损失函数拟合 文章分类 机器学习人工智能

何为线性？何为回归？

线性

线性，包括可加性和齐次性

①可加性，也称叠加性。函数 $线性回归F值线性回归f值是什么_拟合$ 若满足下式
$线性回归F值线性回归f值是什么_线性回归_02$
则称函数 $线性回归F值线性回归f值是什么_拟合$ 具有可加性

②齐次性，也称均匀性。若函数 $线性回归F值线性回归f值是什么_拟合$ 若满足下式
$线性回归F值线性回归f值是什么_线性回归F值_05$
其中，a为与x无关的常数。则称函数 $线性回归F值线性回归f值是什么_拟合$ 具有齐次性

我们其实也可以用一个式子来描述这可加性与齐次性，如下
$线性回归F值线性回归f值是什么_最小二乘法_07$
当函数 $线性回归F值线性回归f值是什么_拟合$ 同时具有可加性与齐次性时，我们则称函数 $线性回归F值线性回归f值是什么_拟合$ 为线性函数

回归

回归是确定多个变量间相互依赖的定量关系

在机器学习中，回归往往指预测的输出为连续值，而线性回归也确实是解决此类任务的

分类任务则是预测的输出为离散型

损失函数

解决回归任务，实际就是找到一条线/超平面来拟合这些样本点，使他们之间的误差尽可能的小。而不同的线/超平面（其中不同的参数值形成的）在同一个数据集下对应着不同的误差，我们则需要找到让误差最小的线/超平面。

现以形如y=kx+b的一元线性函数为例

线性回归F值线性回归f值是什么_最小二乘法_10

淡蓝色为样本点，深蓝色和红色的线为生成的两条线。那你们觉得哪条线跟样本点更加符合整体的趋势呢？也就是哪条线更拟合呢？

你：这想都不用想的好吧！那肯定是蓝色那条线效果好啊！

但它为什么好呢？我们要定量得去描述它。此时则需要引入损失函数（又称误差函数）来衡量误差

回归任务中常用的损失函数有：

均方误差MSE：
$线性回归F值线性回归f值是什么_线性回归F值_11$
均方根误差RMSE：
$线性回归F值线性回归f值是什么_最小二乘法_12$
平均绝对误差MAE：
$线性回归F值线性回归f值是什么_线性回归_13$
R-squared：

$线性回归F值线性回归f值是什么_拟合_14$

可以这么理解：将TSS理解为全部按平均值预测，RSS理解为按模型预测，这就相当于去比较你模型预测和全部按平均值预测的比例，这个比例越小，则模型越精确。当然该指标存在负数的情况，即模型预测还不如全部按平均值预测。越接近1，模型拟合得就越好

最小化损失函数

再次强调：回归任务是拟合样本点，使误差尽可能的小

最小二乘法（一元线性函数）

我们用一元线性函数为例讲解线性回归，其次再引入多元线性回归

此节以一元线性函数y=kx+b为例，采用均方误差MSE作为损失函数，那么损失函数就是关于变量k,b的函数
$线性回归F值线性回归f值是什么_拟合_15$
其中，m为样本个数。此时任务为最小化L(k, b)函数

相信大家在高中或是大学都做过求函数最小值的题，当时是怎么做的呢？求导！让导数=0，求出此时的x，此时的x让函数取得最小值点。但这里是两个变量，那么则求偏导，让偏导=0，求出此时的各个参数，此时的各个参数让损失函数取得最小值，也就是误差最小，也就是拟合效果最好！

对b求偏导

此时，我们对L函数求b的偏导，使用链式求导法则
$线性回归F值线性回归f值是什么_线性回归F值_16$
第一行到第二行：k跟i无关，乘积项可直接提到连加号外面

第二行到第三行：联想一下求均值的公式 $线性回归F值线性回归f值是什么_损失函数_17$ ，实际上把m乘过去就是上面的替换

同时，我们记第三行的式子为①，后续推导有用

对k求偏导

接着，我们对L函数求k的偏导，稍微复杂一些
$线性回归F值线性回归f值是什么_最小二乘法_18$
记第三行得式子为②

接下来式子①* $线性回归F值线性回归f值是什么_最小二乘法_19$ 得式子③
$线性回归F值线性回归f值是什么_损失函数_20$
接着，②-③得
$线性回归F值线性回归f值是什么_拟合_21$
我们现在就求出了使得函数值最小的k, b参数

最小二乘法（多元线性函数）

定义损失函数

如今，我们将一元变量推广到多原变量，设多元函数式为
$线性回归F值线性回归f值是什么_线性回归F值_22$
这个式子太长了，我们使用线性代数的向量概念对该式进行整理，为方便，记 $线性回归F值线性回归f值是什么_拟合_23$ （可以把上函数式的b视为b*1，下面会讲这样做的原因）

此时稍微提一下，在线性代数中，见到一个向量，默认均为列向量，上标为T（转置）的才为行向量（至于为什么要这样规定，是因为竖着写很占版面…你知道它本身是竖着写的就好了）

那么此时，我们构造一个权重向量 $线性回归F值线性回归f值是什么_最小二乘法_24$ 和特征向量 $线性回归F值线性回归f值是什么_线性回归_25$
$线性回归F值线性回归f值是什么_损失函数_26$
那么此时，我们上述的多元函数式则可以写成 $线性回归F值线性回归f值是什么_拟合_27$ 或 $线性回归F值线性回归f值是什么_线性回归_28$ ，是完全等价的