首页|期刊导航|自动化学报|基于自适应噪声的最大熵进化强化学习方法

基于自适应噪声的最大熵进化强化学习方法OA

Adaptive Noise-based Evolutionary Reinforcement Learning With Maximum Entropy

中文摘要

近年来,进化策略由于其无梯度优化和高并行化效率等优点,在深度强化学习领域得到了广泛的应用.然而,传统基于进化策略的深度强化学习方法存在着学习速度慢、容易收敛到局部最优和鲁棒性较弱等问题.为此,提出了一种基于自适应噪声的最大熵进化强化学习方法.首先,引入了一种进化策略的改进办法,在"优胜"的基础上加强了"劣汰",从而提高进化强化学习的收敛速度;其次,在目标函数中引入了策略最大熵正则项,来保证策略的随机性进而鼓励智能体对新策略的探索;最后,提出了自适…查看全部>>

王君逸;王志;李华雄;陈春林

南京大学控制科学与智能工程系 南京210008南京大学控制科学与智能工程系 南京210008南京大学控制科学与智能工程系 南京210008南京大学控制科学与智能工程系 南京210008

深度强化学习进化策略进化强化学习最大熵自适应噪声

《自动化学报》 2023 (1)

面向复杂多模态数据的粒计算模型与方法研究

54-66,13

国家自然科学基金(62006111,62073160,62176116),江苏省自然科学基金(BK20200330)资助

10.16383/j.aas.c220103

评论

您当前未登录!去登录点击加载更多...