简单的一句话:让机器从数据中学习,进而得到一个更加符合现实规律的模型,通过对模型的使用使得机器比以往表现的更好,这就是机器学习
。
机器学习是实现人工智能的一种途径
,它和数据挖掘有一定的相似性
,也是一门多领域交叉学科
,涉及概率论
、统计学
、逼近论
、凸分析
、计算复杂性理论
等多门学科。
对比于数据挖掘从大数据之间找相互特性而言,机器学习更加注重算法的设计,让计算机能够白动地从数据中“学习”规律,并利用规律对未知数据进行预测。因为学习算法涉及了大量的统计学理论,与统计推断联系尤为紧密,所以也被称为统计学习方法。
机器学习可以分为以下五个大类:
(1)监督学习
:从给定的训练数据集中学习出-一个函数,当新的数据到来时,可以根据这个函数预测结果。监督学习的训练集要求是输人和输出,也可以说是特征和目标。训练集中的目标是由人标注的。常见的监督学习算法包括回归与分类。
(2)无监督学习
:无监督学习与监督学习相比,训练集没有人为标注的结果。常见的无监督学习算法有聚类等。
(3)半监督学习
:这是一”种介于监督学习与无监督学习之间的方法。
(4)迁移学习
:将已经训练好的模型参数迁移到新的模型来帮助新模型训练数据集。
(5)增强学习
:通过观察周围环境来学习。每个动作都会对环境有所影响,学习对象根据观察到的周围环境的反馈来做出判断。
传统的机器学习算法有以下几种:
线性回归模型、logistic回归模型、k-临近算法、决策树、随机森林、支持向量机、人工神经网络、EM算法、概率图模型等。
一句话说明机器学习(MachineLearning)
简单的一句话:让机器从数据中学习,进而得到一个更加符合现实规律的模型,通过对模型的使用使得机器比以往表现的更好,这就是机器学习。
详解
数据:从现实生活抽象出来的一些事物或者规律的特征进行数字化得到。
学习:在数据的基础上让机器重复执行一套特定的步骤(学习算法)进行事物特征的萃取,得到一个更加逼近于现实的描述(这个描述是一个模型它的本身可能就是一个函数)。我们把大概能够描述现实的这个函数称作我们学到的模型。
Machine -> ML -> better
更好:我们通过对模型的使用就能更好的解释世界,解决与模型相关的问题。