强化学习研究综述OACSTPCD

Research on Reinforcement Learning Technology: A Review

中文摘要

强化学习是机器学习领域内的研究热点,主要用来实现决策优化.首先介绍了强化学习的基本原理和经典算法,包括基于值函数的强化学习算法和基于直接策略搜索的强化学习算法;然后针对强化学习目前受关注较多的3个方向:深度强化学习、元强化学习和逆向强化学习分别进行阐述.最后总结了强化学习目前已有的应用和未来可能发展的方向.

作者：马骋乾;谢伟;孙伟杰

作者单位：国防科技大学信息通信学院, 湖北武汉 430019国防科技大学信息通信学院, 湖北武汉 430019国防科技大学信息通信学院, 湖北武汉 430019

分类：信息技术与安全科学

中文关键词：强化学习深度强化学习元强化学习逆向强化学习决策优化

刊名：《指挥控制与仿真》 2018 (6)

页码/页数：68-72,5

DOI：10.3969/j.issn.1673-3819.2018.06.015

您当前未登录！

去登录

点击加载更多...

强化学习研究综述OACSTPCD

Research on Reinforcement Learning Technology: A Review

评论