今天在学习过程中碰到一个自己不懂的常识:Reinforcement Learing(强化学习)
之前在入门机器学习过程中单纯的知道只有深度学习,今天看论文的时候发现还存在强化学习,所以今天就干脆将深度学习与强化学习两者是啥以及二者的区别是什么记录在这里。
1.深度学习
深度学习本质上是一个自主的、自学的系统,您可以使用现有的数据来训练算法来发现模式,然后使用这些模式来预测新的数据。 例如,你可以训练一个深度学习算法来识别照片上的猫。你可以通过给它输入数以百万计的图像来达到这个目的,这些图像要么包含猫,要么不包含猫。然后,该程序将通过对图像数据(例如,边缘、形状、颜色、形状之间的距离等)进行分类和聚类来建立模式。这些模式将形成一个预测模型,该预测模型能够查看一组新图像并预测图像中是否包含猫。
深度学习算法通过类似人的大脑中神经元网络的人工神经网络来实现这一点。 这允许算法执行各种循环以缩小模式并改进每个循环的预测结果。
在实践中深度学习的一个很好的例子是Apple的Face ID。在设置手机时,你可以通过扫描脸部来训练算法。每次您登录时,例如使用面部ID,TrueDepth摄像头将捕获数千个数据点,这些数据点将创建您面部的深度图,手机内置的神经引擎将执行分析,以预测登陆的人是不是你。
2.强化学习
强化学习也是一种自主性、自学习的学习系统,本质上是一种反复尝试的学习。
强化学习是一类算法, 是让计算机实现从一开始什么都不懂, 脑袋里没有一点想法, 通过不断地尝试, 从错误中学习, 最后找到规律, 学会了达到目的的方法. 这就是一个完整的强化学习过程.
实际中的强化学习例子有很多, 比如近期最有名的 Alpha go, 机器头一次在围棋场上战胜人类高手, 让计算机自己学着玩经典游戏 Atari, 这些都是让计算机在不断的尝试中更新自己的行为准则, 从而一步步学会如何下好围棋, 如何操控游戏得到高分.
3.二者的区别
深度学习和强化学习都是自主学习的系统。 它们之间的区别在于,深度学习是从一个训练集学习,然后将该学习应用到一个新的数据集,而强化学习是通过在连续反馈的基础上调整动作来动态学习,以最大化回报。
深度学习和强化学习并不是相互排斥的。 事实上,你可以在强化学习系统中使用深度学习,这被称为深度强化学习。