回归分析中的se是什么意思线性回归中se是什么意思

转载

IT剑客之家 2024-08-26 11:36:05

文章标签 回归分析中的se是什么意思交叉熵线性回归逻辑回归 KL散度 文章分类 机器学习人工智能

想要了解线性回归和逻辑回归的差别，我们首先要明白线性回归中的线性具体是什么意思，请参考这篇文章：#深入理解# 线性回归中的“线性”、以及最小二乘和梯度下降的理解

1. 线性回归

线性回归中的线性是将拟合函数中的x看做是常数，参数看作是自变量后，函数的最高次项为1；形式为：

回归分析中的se是什么意思线性回归中se是什么意思_回归分析中的se是什么意思

线性回归中的线性只是指其中的拟合函数是线性，和损失函数没有关系；损失函数是衡量一个拟合函数和真实值之间偏差的一种函数

损失函数一般使用 MSE、RMSE、MAE等，因为逻辑回归输出值是0~1本身给出的就是一个该概率值，而线性回归没有激活函数需要使用某种方式构造一种损失，那么最容易想到的便是最小二乘或RMSE，MAE等

2. 逻辑回归（LR）

逻辑回归在线性回归的基础上增加了激活函数（sigmoid）将输出限制在0到1，因此我们用交叉熵作为逻辑回归的损失函数，这里简述以下交叉熵和sigmoid激活函数：

2.1 交叉熵

1. 熵的定义：

$H(x)=-\sum_{i=1}^{n}p(x_i)log(p(x_i))$

2. KL散度的定义：

$D_{KL}(p||q)=\sum_{i=1}^{n}p(x_i)log(\frac{p(x_i)}{q(x_i)})=\sum_{i=1}^{n}p(x_i)log(p(x_i))-\sum_{i=1}^{n}p(x_i)log(q(x_i))= -H(p)+[-\sum_{i=1}^{n}p(x_i) log(q(x_i))]$

因为标签分布不变，所以

回归分析中的se是什么意思线性回归中se是什么意思_线性回归_05

可以看作常数，因此最小化KL散度等价于最小化后边这一项，这一项就是交叉熵

3.交叉熵的定义

回归分析中的se是什么意思线性回归中se是什么意思_逻辑回归_07

KL散度是在p分布为基础衡量不同q分布和q分布的相似程度，KL散度越小，p和q的分布越相似，最小化交叉熵等价于最小化KL散度

2.2 sigmoid激活函数

sigmoid激活函数及其导数为：

$y=\frac{1}{1+e^{-x}} \qquad y'=y*(1-y)$

2.3 二元交叉熵损失函数

针对上述交叉熵公式，我们可以从两个方面来理解：

2.3.1

回归分析中的se是什么意思线性回归中se是什么意思_回归分析中的se是什么意思_09

2.3.2 用极大似然估计的思想推导交叉熵公式：

$like\quad lihood = \prod_{i=1}^{m}P(x_i|\theta )=\prod_{i=1}^{m}h_\theta (i)^{y_i}*(1-h_\theta(i))^{1-y_i}\\ - log\quad likelihood = -\frac{1}{m}\sum_{i=1}^{m}y_ilogh_\theta (i)+(1-y_i)log(1-h_\theta (i))$