计算机技术与发展2023,Vol.33Issue(10):101-108,8.DOI:10.3969/j.issn.1673-629X.2023.10.016
带Q网络过滤的两阶段TD3深度强化学习方法
Two-stage TD3 Deep Reinforcement Learning Algorithm with Q Network Filtration
摘要
关键词
两阶段深度强化学习/冷启动问题/模仿学习/预训练网络/TD3Key words
two-stage deep reinforcement learning/cold start/imitation learning/pretraining network/TD3分类
信息技术与安全科学引用本文复制引用
周娴玮,包明豪,叶鑫,余松森..带Q网络过滤的两阶段TD3深度强化学习方法[J].计算机技术与发展,2023,33(10):101-108,8.基金项目
广东省应用型科技研发重大专项(2016B020244003) (2016B020244003)
广东省基础与应用基础研究基金(2020B1515120089,2020A1515110783) (2020B1515120089,2020A1515110783)
广东省企业科技特派员项目(GDKTP2020014000) (GDKTP2020014000)