机器学习(三)

学习机器学习过程中的心得体会以及知识点的整理,方便我自己查找,也希望可以和大家一起交流。

—— 吴恩达机器学习第五章 ——

四、逻辑回归

  1. 线性回归局限性
    线性回归对于分类问题的局限性:由于离群点的存在,线性回归不适用于分类问题。如下图(阈值为0.5),由于最右离群点,再用线性回归与实际情况不拟合。
  2. 逻辑回归限制特征重要性最大值 逻辑回归模型的局限性_线性回归

  3. 因此,我们引入 逻辑回归 算法,来解决这个问题。
  4. 假设陈述
    逻辑回归的假设函数值总是在0到1之间,逻辑回归模型:逻辑回归限制特征重要性最大值 逻辑回归模型的局限性_人工智能_02, 使得 逻辑回归限制特征重要性最大值 逻辑回归模型的局限性_人工智能_03
    在线性回归中,逻辑回归限制特征重要性最大值 逻辑回归模型的局限性_机器学习_04 ,在逻辑回归中令逻辑回归限制特征重要性最大值 逻辑回归模型的局限性_逻辑回归_05 ,将逻辑回归限制特征重要性最大值 逻辑回归模型的局限性_机器学习_06带入g(x)得:
  5. 逻辑回归限制特征重要性最大值 逻辑回归模型的局限性_逻辑回归限制特征重要性最大值_07

  6. 其中逻辑回归限制特征重要性最大值 逻辑回归模型的局限性_机器学习_08被称为Sigmoid函数,也叫Logistic函数。
  7. 逻辑回归限制特征重要性最大值 逻辑回归模型的局限性_线性回归_09

  8. 逻辑回归限制特征重要性最大值 逻辑回归模型的局限性_逻辑回归_10( 对于输入的x,y=1的概率估计)
  9. 决策界限
    决策边界不是训练集的属性,而是假设本身及其参数的属性。
    假设有一个训练集:逻辑回归限制特征重要性最大值 逻辑回归模型的局限性_逻辑回归限制特征重要性最大值_11。用一种方法或者假设,得到参数逻辑回归限制特征重要性最大值 逻辑回归模型的局限性_线性回归_12。预测 逻辑回归限制特征重要性最大值 逻辑回归模型的局限性_逻辑回归限制特征重要性最大值_13,即逻辑回归限制特征重要性最大值 逻辑回归模型的局限性_机器学习_14。则有下图,中间洋红色直线即为 决策边界逻辑回归限制特征重要性最大值 逻辑回归模型的局限性_人工智能_15
  10. 逻辑回归限制特征重要性最大值 逻辑回归模型的局限性_人工智能_16

  11. 其他的例子如下图:
  12. 逻辑回归限制特征重要性最大值 逻辑回归模型的局限性_逻辑回归限制特征重要性最大值_17

  13. 其他参数更多更复杂的也同理。
  14. 代价函数
    将线性回归的代价函数改写为如下形式:
    逻辑回归限制特征重要性最大值 逻辑回归模型的局限性_机器学习_18,进而定义cost函数为逻辑回归限制特征重要性最大值 逻辑回归模型的局限性_逻辑回归限制特征重要性最大值_19
  15. 逻辑回归限制特征重要性最大值 逻辑回归模型的局限性_机器学习_20

  16. 将cost function 运用到逻辑回归中:.
  17. 逻辑回归限制特征重要性最大值 逻辑回归模型的局限性_逻辑回归限制特征重要性最大值_21

  18. 其中 y 表示实际,hθ(x)表示预测。
  • 当y = 1时:
    逻辑回归限制特征重要性最大值 逻辑回归模型的局限性_人工智能_22
    逻辑回归限制特征重要性最大值 逻辑回归模型的局限性_逻辑回归限制特征重要性最大值_23(预测与实际完全不一致,要花费很大的代价惩罚算法)
  • 当y = 0时:
    逻辑回归限制特征重要性最大值 逻辑回归模型的局限性_机器学习_24
    逻辑回归限制特征重要性最大值 逻辑回归模型的局限性_机器学习_25 (预测与实际完全不一致,要花费很大的代价惩罚算法)
  1. 简化代价函数与梯度下降

    将上述式子合并为一个式子:逻辑回归限制特征重要性最大值 逻辑回归模型的局限性_机器学习_26
    当y = 1时,后一个式子整体为0;当y = 0时,前一个式子整体为0。进而得到:
    逻辑回归限制特征重要性最大值 逻辑回归模型的局限性_人工智能_27
    求最小代价函数由逻辑回归限制特征重要性最大值 逻辑回归模型的局限性_逻辑回归_28,得逻辑回归限制特征重要性最大值 逻辑回归模型的局限性_人工智能_29

注意:

  • 逻辑回归的代价函数看似与线性回归的代价函数相同,但本质不同。
  • 逻辑回归中的逻辑回归限制特征重要性最大值 逻辑回归模型的局限性_人工智能_30
  • 线性回归中的逻辑回归限制特征重要性最大值 逻辑回归模型的局限性_逻辑回归限制特征重要性最大值_31
  1. 逻辑回归解决问题:多元分类
    多元分类即结果有多种可能。如下图,有三种可能结果。
  2. 逻辑回归限制特征重要性最大值 逻辑回归模型的局限性_人工智能_32

  3. 将它们两两作为一组,方法是将其中一个类别作为正类,其他作为负类,依次建立新的训练集,得到
  4. 逻辑回归限制特征重要性最大值 逻辑回归模型的局限性_逻辑回归限制特征重要性最大值_33


  5. 逻辑回归限制特征重要性最大值 逻辑回归模型的局限性_人工智能_34


  6. 逻辑回归限制特征重要性最大值 逻辑回归模型的局限性_线性回归_35

  7. 即为逻辑回归限制特征重要性最大值 逻辑回归模型的局限性_逻辑回归_36,最后需要输入一个x,选择h最大的类别,也即在三个分类器中选择可信度最高,效果最好的。