- 二、感知机
- 三、K近邻法
一、统计学习方法概论
1.1、基本概念
将输入和输出的所有可能的取值的集合分别成为输入空间(input space)和输出空间(output space)。
输入的实例,通常由特征向量表示,所有特征向量存在的空间成为特征空间,特征空间的每一维对应一个特征。
2、联合概率分布
X,Y
X
,
Y
遵循联合概率分布
P(X,Y)
P
(
X
,
Y
)
。则
P(X,Y)
P
(
X
,
Y
)
为分布函数 (密度函数)。
3、假设空间
监督学习目的在于:学习一个由输入与输出的映射形成的这一模型。输入空间与输出空间的映射集合,就是假设空间
1.2、问题的形式化
1.3、统计学习三要素
1.3.1、常用的几种损失函数(loss function)
1.3.2、经验风险最小化与结构风险最小化
1.4、模型评估和选择
1.4.1、训练误差与测试误差
1.4.2、过拟合和模型的选择
1.5、正则化和交叉验证
1.6、分类问题
二、感知机
2.1、感知机模型
2.2、算法的收敛性
三、K近邻法
3.1、K近邻属性
3.2、距离度量
R2
R
2
,使用的距离是欧式距离,也可以使用其他的距离,如下:
3.3、k值的选择
3.4、K近邻搜索:kd树
3.5、搜索方法
四、朴素贝叶斯
4.1、原理
4.2、极大似然估计
4.3、计算 分类的步骤
4.4、贝叶斯估计(类似于拉普拉斯平滑)