机器学习是实现人工智能的手段,其主要研究内容是如何利用数据或经验进行学习,改善具体算法的性能。多领域交叉,涉及概率论、统计学,算法复杂度理论等多门学科。
广泛应用于网络搜索、垃圾邮件过滤、推荐系统、广告投放、信用评价、欺诈检测、股票交易和医疗诊断等应用。
-
监督学习(Supervised Learning)
给定的训练数据集中学习出一个函数,当新的数据集到来时,可以根据这个函数预计出结果,训练集通常由人工标注
-
无监督学习(Unsupervised Learning)
训练集没有人工标注的结果
-
半监督学习(Semi-supervised Learning)
介于监督学习和无监督学习之间
-
强化学习(Reinforcement Learning,增强学习)
通过观察来学习执行什么样的动作来获得最好的回报,每个动作都会对环境造成影响,研究对象通过对环境反馈的判断,来继续学习
-
深度学习(Deep Learning)
利用深层神经网络模型,抽象数据的表示特征的一种方法
- 一组简单有效的工具集
- 依赖Python的NumPy,SciPy和matplotlib库
- 开源,可复用的
Scikit-learn常用函数
- 了解基本的机器学习原理及算法
- 学习利用机器学习算法解决应用问题的能力
- 掌握sklearn库中常用机器学习算法的基本调用方法,避免重复造车。