控制理论与应用2022,Vol.39Issue(2):P.222-230,9.DOI:10.7641/CTA.2021.10077
多步积累奖励的双重时序Q网络算法
摘要
关键词
深度强化学习/无人车/多步积累奖励/时序网络/数据利用率分类
信息技术与安全科学引用本文复制引用
朱威,谯先锋,陈艺楷,何德峰..多步积累奖励的双重时序Q网络算法[J].控制理论与应用,2022,39(2):P.222-230,9.基金项目
浙江省自然科学基金项目(LY21F010009) (LY21F010009)
国家自然科学基金项目(61773345) (61773345)
汽车仿真与控制国家重点实验室开放基金项目(20171103)资助。 (20171103)