逆强化学习算法、理论与应用研究综述OA北大核心CSTPCD
随着高维特征表示与逼近能力的提高,强化学习(Reinforcement learning,RL)在博弈与优化决策、智能驾驶等现实问题中的应用也取得显著进展.然而强化学习在智能体与环境的交互中存在人工设计奖励函数难的问题,因此研究者提出了逆强化学习(Inverse reinforcement learning,IRL)这一研究方向.如何从专家演示中学习奖励函数和进行策略优化是一个重要的研究课题,在人工智能领域具有十分重要的研究意义.本文综合介绍了逆强化学习算法的最新进展,首先介绍了逆强化学习在理论方面的新进展,然后分析了逆强化学习面临的挑战以及未来的发展趋势,最后讨论了逆强化学习的应用进展和应用前景.
宋莉;李大字;徐昕;
北京化工大学信息科学与技术学院,北京100029国防科技大学智能科学学院,长沙410073
计算机与自动化
强化学习逆强化学习线性逆强化学习深度逆强化学习对抗逆强化学习
《自动化学报》 2024 (009)
P.1704-1723 / 20
国家自然科学基金(62273026)资助。
评论