首页|期刊导航|自动化学报|基于自适应噪声的最大熵进化强化学习方法

基于自适应噪声的最大熵进化强化学习方法OA

Adaptive Noise-based Evolutionary Reinforcement Learning With Maximum Entropy

中文摘要

近年来,进化策略由于其无梯度优化和高并行化效率等优点,在深度强化学习领域得到了广泛的应用.然而,传统基于进化策略的深度强化学习方法存在着学习速度慢、容易收敛到局部最优和鲁棒性较弱等问题.为此,提出了一种基于自适应噪声的最大熵进化强化学习方法.首先,引入了一种进化策略的改进办法,在"优胜"的基础上加强了"劣汰",从而提高进化强化学习的收敛速度;其次,在目标函数中引入了策略最大熵正则项,来保证策略的随机性进而鼓励智能体对新策略的探索;最后,提出了自适…查看全部>>

作者：王君逸;王志;李华雄;陈春林

作者单位：南京大学控制科学与智能工程系南京210008南京大学控制科学与智能工程系南京210008南京大学控制科学与智能工程系南京210008南京大学控制科学与智能工程系南京210008

中文关键词：深度强化学习进化策略进化强化学习最大熵自适应噪声

刊名：《自动化学报》 2023 (1)

相关项目：面向复杂多模态数据的粒计算模型与方法研究

页码/页数：54-66,13

基金：国家自然科学基金(62006111,62073160,62176116),江苏省自然科学基金(BK20200330)资助

DOI：10.16383/j.aas.c220103

您当前未登录！

去登录

点击加载更多...

基于自适应噪声的最大熵进化强化学习方法OA

Adaptive Noise-based Evolutionary Reinforcement Learning With Maximum Entropy

评论