深度强化学习局部策略迁移方法OA北大核心CSTPCD
Deep Reinforcement Learning Local Policy Transfer Method
[目的]强化学习策略迁移是一条降低深度强化学习训练消耗的有效途径,其中,局部策略迁移是在较小粒度上实 现策略的迁移,它对整体策略性能 的提升和策略灵活组合形成新整体策略有重要意义.提出了深度强化学习局部策略迁移方法.[方法]借鉴了软件工程中"高内聚,低耦合"的思想,通过对作为策略载体的神经网络进行划分,使得不同子神经网络承载不同局部策略,然后通过对子神经网络的迁移,实现局部策略迁移.该方法支持局部策略灵活替换和组合,形成性能更优秀和适应新环境的新…查看全部>>
[Purposes]Reinforcement learning policy transfer is an effective way to reducing the consumption of deep reinforcement learning training.Local policy transfer is policy transfer at a fine-grained level,which is of great significance to the improvement of the global policy per-formance and the formation of a new global policy by the combination of local policies.There-fore,a deep reinforcement learning method for local policy transfer is proposed.[Methods]Thi…查看全部>>
史腾飞;王莉;臧嵘
北方自动控制技术研究所,太原 030006太原理工大学计算机与科学技术学院(大数据学院),晋中 030600山西证券股份有限公司,太原 030032
计算机与自动化
深度强化学习局部策略迁移DQN
deep reinforcement learninglocal policy transferDQN
《太原理工大学学报》 2024 (4)
705-711,7
评论