强化学习研究综述OACSTPCD
Research on Reinforcement Learning Technology: A Review
强化学习是机器学习领域内的研究热点,主要用来实现决策优化.首先介绍了强化学习的基本原理和经典算法,包括基于值函数的强化学习算法和基于直接策略搜索的强化学习算法;然后针对强化学习目前受关注较多的3个方向:深度强化学习、元强化学习和逆向强化学习分别进行阐述.最后总结了强化学习目前已有的应用和未来可能发展的方向.
马骋乾;谢伟;孙伟杰
国防科技大学信息通信学院, 湖北 武汉 430019国防科技大学信息通信学院, 湖北 武汉 430019国防科技大学信息通信学院, 湖北 武汉 430019
信息技术与安全科学
强化学习深度强化学习元强化学习逆向强化学习决策优化
《指挥控制与仿真》 2018 (6)
68-72,5
评论