离散型变量回归分析

转载

mob64ca1405d568 2025-01-04 14:53:39

文章标签 离散型变量回归分析 softmax回归交叉熵损失函数线性回归 文章分类 机器学习人工智能

离散值预测问题，介绍神经网络中的分类模型

分类的基本问题

一般连续值到离散值的转化通常会影响到分类质量。
因此，我们一般使用更适合离散值输出的模型来解决分类问题。

一、softmax回归模型

与线性回归的主要不同在于：softmax回归的输出值个数等于标签里的类别数。

在这里类似于线性回归中的房屋预测问题，给出猫狗分类问题进行分析。

假设输入一共有四种特征，和三种输出动物类别(猫-1，狗-2，鸡-3)，所以权重包含１２个标量(w), 偏差包含3个标量(b), 给出表达式人如下:

离散型变量回归分析_离散型变量回归分析

用神经网络描绘上述计算:

离散型变量回归分析_交叉熵_02

分析: 既然分类问题需要得到离散的预测输出，一个简单的办法是将输出值O(i)当做预测类别是i的置信度，并将值最大的输出所对应的类作为预测输出.

argmax(O(i)), 那个值最大，那么预测的类别为该值对应的类别

问题分析

然而，直接使用输出层的输出有两个问题。一方面，由于输出层的输出值的范围不确定，我们难以直观上判断这些值的意义。例如，刚才举的例子中的三个输出值(10, 0.1, 0.1)表示“很置信”图像类别为猫，因为该输出值是其他两类的输出值的100倍。但如果o2=o3=1000，那么输出值10却又表示图像类别为猫的概率很低。另一方面，由于真实标签是离散值，这些离散值与不确定范围的输出值之间的误差难以衡量。

softmax运算符解决了以上两个问题，　它通过下式将输出值变为值为正且和为１的概率分布:

离散型变量回归分析_线性回归_03