| 注册
首页|期刊导航|控制理论与应用|多步积累奖励的双重时序Q网络算法

多步积累奖励的双重时序Q网络算法

朱威 谯先锋 陈艺楷 何德峰

控制理论与应用2022,Vol.39Issue(2):P.222-230,9.
控制理论与应用2022,Vol.39Issue(2):P.222-230,9.DOI:10.7641/CTA.2021.10077

多步积累奖励的双重时序Q网络算法

朱威 1谯先锋 1陈艺楷 1何德峰1

作者信息

  • 1. 浙江工业大学信息工程学院,浙江杭州310023
  • 折叠

摘要

关键词

深度强化学习/无人车/多步积累奖励/时序网络/数据利用率

分类

信息技术与安全科学

引用本文复制引用

朱威,谯先锋,陈艺楷,何德峰..多步积累奖励的双重时序Q网络算法[J].控制理论与应用,2022,39(2):P.222-230,9.

基金项目

浙江省自然科学基金项目(LY21F010009) (LY21F010009)

国家自然科学基金项目(61773345) (61773345)

汽车仿真与控制国家重点实验室开放基金项目(20171103)资助。 (20171103)

控制理论与应用

OA北大核心CSCDCSTPCD

1000-8152

访问量0
|
下载量0
段落导航相关论文