首页|期刊导航|控制理论与应用|多步积累奖励的双重时序Q网络算法

多步积累奖励的双重时序Q网络算法

朱威谯先锋陈艺楷何德峰

控制理论与应用2022，Vol.39Issue(2)：P.222-230,9.

控制理论与应用2022，Vol.39Issue(2)：P.222-230,9.DOI:10.7641/CTA.2021.10077

朱威 ¹谯先锋 ¹陈艺楷 ¹何德峰¹

作者信息

深度强化学习/无人车/多步积累奖励/时序网络/数据利用率

信息技术与安全科学

朱威,谯先锋,陈艺楷,何德峰..多步积累奖励的双重时序Q网络算法[J].控制理论与应用,2022,39(2):P.222-230,9.

浙江省自然科学基金项目(LY21F010009) （LY21F010009）

国家自然科学基金项目(61773345) （61773345）

汽车仿真与控制国家重点实验室开放基金项目(20171103)资助。（20171103）

OA北大核心CSCDCSTPCD

ISSN：1000-8152

访问量0

下载量0

段落导航