1.k-近邻算法概述简单地说,k-近邻算法采用测量不同特征值之间的距离方法进行分类优点:精度高、对异常值不敏感、无数据输入假定。缺点:计算复杂度高、空间复杂度高。适用数据范围:数值型和标称型。标称型:标称型目标变量的结果只在有限目标集中取值,如真与假(标称型目标变量主要用于分类)数值型:数值型目标变量则可以从无限的数值集合中取值,如0.100,42.001等 (数值型目标变量主要用于回归分析)2.
本次使用的是python语言以及Scikit-learn库,实验环境使用的是Linux下的iPython。1.首先将添加sklearn库中的决策树tree接着引入一些模型特征,我这里使用认的身高和是否有胡子来作为特征(features),而性别来作为标签(labels)。建立如下:(tips:数据量越大,模型越好,那么结果就会越精确,这里只引入3男3女的特征来做个示范)代码如下: 有了数据模型之后
Copyright © 2005-2025 51CTO.COM 版权所有 京ICP证060544号