1993年的分层强化学习:Feudal Reinforcement Learning 概括1992年没有深度学习,人们研究RL的思路与现在并不相同。但不可否认,提出“分层强化学习”是解决“泛化、学习速度”等问题的一个很好的思路。Feudal 类似从宏观到微观地去分层指挥,这里有一点值得注意,那就是“层层封装”,A-B-C,C只去执行B给他下达的目标(或者说感受以此设计的奖励机制),而不去管A的;
Copyright © 2005-2024 51CTO.COM 版权所有 京ICP证060544号