| 注册
首页|期刊导航|计算机技术与发展|带Q网络过滤的两阶段TD3深度强化学习方法

带Q网络过滤的两阶段TD3深度强化学习方法

周娴玮 包明豪 叶鑫 余松森

计算机技术与发展2023,Vol.33Issue(10):101-108,8.
计算机技术与发展2023,Vol.33Issue(10):101-108,8.DOI:10.3969/j.issn.1673-629X.2023.10.016

带Q网络过滤的两阶段TD3深度强化学习方法

Two-stage TD3 Deep Reinforcement Learning Algorithm with Q Network Filtration

周娴玮 1包明豪 1叶鑫 1余松森1

作者信息

  • 1. 华南师范大学 软件学院,广东 佛山 528000
  • 折叠

摘要

关键词

两阶段深度强化学习/冷启动问题/模仿学习/预训练网络/TD3

Key words

two-stage deep reinforcement learning/cold start/imitation learning/pretraining network/TD3

分类

信息技术与安全科学

引用本文复制引用

周娴玮,包明豪,叶鑫,余松森..带Q网络过滤的两阶段TD3深度强化学习方法[J].计算机技术与发展,2023,33(10):101-108,8.

基金项目

广东省应用型科技研发重大专项(2016B020244003) (2016B020244003)

广东省基础与应用基础研究基金(2020B1515120089,2020A1515110783) (2020B1515120089,2020A1515110783)

广东省企业科技特派员项目(GDKTP2020014000) (GDKTP2020014000)

计算机技术与发展

OACSTPCD

1673-629X

访问量0
|
下载量0
段落导航相关论文