文章目录

  • ​​前言​​
  • ​​第 1 章​​
  • ​​第 2 章 模型评估与选择​​
  • ​​参考​​

前言

Task01:概览西瓜书+南瓜书第1章、第2章_搜索


​​之前的机器学习的笔记链接​

第 1 章

Task01:概览西瓜书+南瓜书第1章、第2章_机器学习_02

      上面公式的结论就是总误差与学习算法无关,无论效果多好或多坏,它们的期望性能是一样的,这是NFL定理(No Free Lunch Theorem) 没有“免费的午餐“定理

      这是你可能会想这学个屁算法,所有的学习算法和你瞎猜一样,真的是这样吗?显而易见不是的,上面定理存在的一个重要前提是就是f都是均匀分布,就是真实目标函数均匀分布,个人理解就是所有的结果猜想的概率都是一样的,想我是否想去干饭?目标函数是有什么菜,吃佛跳墙和吃白粥对我想去吃的欲望可能性是一样的大的,但是现实是我肯定想吃佛跳墙(#虽然我没吃过www)

学多了

      但是有时觉得机器相比于机器,机器太笨了,即使阿尔法狗能干掉世界第一的围棋高手,它也教不会一个小孩为什么1+1=2,也教不会小孩明白ta是不是从垃圾桶捡来,也做不饭给我干。当然这些扯得有点远了,从计算机视觉方法,图像识别,一个小孩识别出一个物体是否是车,只要有几个样本告诉它车大概是这样,接下来ta能轻松辨别出一个物体是否是车,但是机器不行,喂了几千张图片,还是识别效果不好,但是机器有一个人无法相比的优点就是速度快而且不会疲惫,只要人给予教会它一些规律(算法),它能为我们做很多事情(智慧司法,智慧城市,智慧金融,智慧交通等)

第 2 章 模型评估与选择

Task01:概览西瓜书+南瓜书第1章、第2章_数据集_03


感悟:

<1> bootstrapping 自助法在随机森林里面也有用到,1份数据集D,通过n次自助抽样,生成n份数据集(每份数据集大概是D的63.2%,通过上面的极限公式可以求解出来),然后生成n个决策树,每个决策树基本是相互独立的,通过降低方差来降低误差,至于为什么能降低误差

Task01:概览西瓜书+南瓜书第1章、第2章_搜索_04

​​详细一点的链接​

参考

​Datawhale的github开源吃瓜教程项目​​,目的:一起吃冰西瓜