基于自适应噪声的最大熵进化强化学习方法OA
Adaptive Noise-based Evolutionary Reinforcement Learning With Maximum Entropy
近年来,进化策略由于其无梯度优化和高并行化效率等优点,在深度强化学习领域得到了广泛的应用.然而,传统基于进化策略的深度强化学习方法存在着学习速度慢、容易收敛到局部最优和鲁棒性较弱等问题.为此,提出了一种基于自适应噪声的最大熵进化强化学习方法.首先,引入了一种进化策略的改进办法,在"优胜"的基础上加强了"劣汰",从而提高进化强化学习的收敛速度;其次,在目标函数中引入了策略最大熵正则项,来保证策略的随机性进而鼓励智能体对新策略的探索;最后,提出了自适…查看全部>>
王君逸;王志;李华雄;陈春林
南京大学控制科学与智能工程系 南京210008南京大学控制科学与智能工程系 南京210008南京大学控制科学与智能工程系 南京210008南京大学控制科学与智能工程系 南京210008
深度强化学习进化策略进化强化学习最大熵自适应噪声
《自动化学报》 2023 (1)
面向复杂多模态数据的粒计算模型与方法研究
54-66,13
国家自然科学基金(62006111,62073160,62176116),江苏省自然科学基金(BK20200330)资助
评论