交通信息与安全2022,Vol.40Issue(1):P.144-152,9.
基于融合离散动作的双延迟深度确定性策略梯度算法的自动驾驶端到端行为决策方法
摘要
关键词
自动驾驶/端到端决策/深度强化学习/动作空间分类
交通工程引用本文复制引用
杨璐,王一权,刘佳琦,段玉林,张荣辉..基于融合离散动作的双延迟深度确定性策略梯度算法的自动驾驶端到端行为决策方法[J].交通信息与安全,2022,40(1):P.144-152,9.基金项目
中国农业科学院国际农业科学计划项目(CAAS-ZDRW202107) (CAAS-ZDRW202107)
国家自然科学基金项目(52172350、51775565) (52172350、51775565)
天津市研究生科研创新项目(2020YJSZXS05)资助。 (2020YJSZXS05)