文章目录

  • 一、逻辑回归概述
  • 二、L1和L2的区别
  • 三、逻辑回归中的特征工程
  • 四、梯度下降:重要参数max_iter
  • 总结


一、逻辑回归概述

面试高危问题:Sigmoid函数的公式和性质

Sigmoid函数是一个S型的函数,当自变量z趋近正无穷时,因变量g(z)趋近于1,而当z趋近负无穷时,g(z)趋近于0,它能够将任何实数映射到(0,1)区间,使其可用于将任意值函数转换为更适合二分类的函数。因为这个性质,Sigmoid函数也被当作是归一化的一种方法,与我们之前学过的MinMaxSclaer同理,是属于数据预处理中的“缩放”功能,可以将数据压缩到[0,1]之内。区别在于,MinMaxScaler归一化之后,是可以取到0和1的(最大值归一化后就是1,最小值归一化后就是0),但Sigmoid函数只是无限趋近于0和1。

逻辑回归x值必须全是01吗_sklearn


逻辑回归x值必须全是01吗_迭代_02


我们已经了解了逻辑回归的本质,它是一个返回对数几率的,在线性数据上表现优异的分类器,它主要被应用在金融领域。其数学目的是求解能够让模型对数据拟合程度最高的参数 的值,以此构建预测函数 ,然后将特征矩阵输入预测函数来计算出逻辑回归的结果y。注意,虽然我们熟悉的逻辑回归通常被用于处理二分类问题,但逻辑回归也可以做多分类。

二、L1和L2的区别

逻辑回归x值必须全是01吗_学习_03

三、逻辑回归中的特征工程

逻辑回归x值必须全是01吗_逻辑回归x值必须全是01吗_04


逻辑回归x值必须全是01吗_逻辑回归x值必须全是01吗_05


逻辑回归x值必须全是01吗_sklearn_06

四、梯度下降:重要参数max_iter

逻辑回归x值必须全是01吗_sklearn_07


核心误区:到底在哪个函数上,求什么的偏导数?

一个多元函数的梯度,是对其自变量求偏导的结果,不是对其参数求偏导的结果。但是在逻辑回归的数学过程中,损失函数的自变量刚好是逻辑回归的预测函数y(x)的参数,所以才造成了这种让人误解的,“对多元函数的参数求偏导”的写法。务必记住,正确的做法是:在多元函数(损失函数)上对自变量(逻辑回归的预测函数y(x)的参数)求偏导,求解梯度的方式,和逻辑回归本身的预测函数y(x)没有一丝联系。

逻辑回归x值必须全是01吗_学习_08


逻辑回归x值必须全是01吗_学习_09


逻辑回归x值必须全是01吗_逻辑回归_10


核心误区:步长到底是什么?

步长不是任何物理距离,它甚至不是梯度下降过程中任何距离的直接变化,它是梯度向量的大小 上的一个比例,影响着参数向量 每次迭代后改变的部分。

但是在我们开始梯度下降之前,我们并不知道什么样的步长才合适,但梯度下降一定要在某个时候停止才可以,否则模型可能会无限地迭代下去。因此,在sklearn当中,我们设置参数max_iter最大迭代次数来代替步长,帮助我们控制模型的迭代速度并适时地让模型停下。max_iter越大,代表步长越小,模型迭代时间越长,反之,则代表步长设置很大,模型迭代时间很短。迭代结束,获取到损失函数的最小值后,我们就可以找出这个最小值对应的参数向量 ,逻辑回归的预测函数也就可以根据这个参数向量 来建立了。

逻辑回归x值必须全是01吗_逻辑回归x值必须全是01吗_11


逻辑回归x值必须全是01吗_学习_12

总结