| 注册
首页|期刊导航|交通信息与安全|基于融合离散动作的双延迟深度确定性策略梯度算法的自动驾驶端到端行为决策方法

基于融合离散动作的双延迟深度确定性策略梯度算法的自动驾驶端到端行为决策方法

杨璐 王一权 刘佳琦 段玉林 张荣辉

交通信息与安全2022,Vol.40Issue(1):P.144-152,9.
交通信息与安全2022,Vol.40Issue(1):P.144-152,9.

基于融合离散动作的双延迟深度确定性策略梯度算法的自动驾驶端到端行为决策方法

杨璐 1王一权 1刘佳琦 1段玉林 2张荣辉3

作者信息

  • 1. 天津理工大学天津市先进机电系统设计与智能控制重点实验室,天津300384 天津理工大学机电工程国家级实验教学示范中心,天津300384
  • 2. 中国农业科学院农业资源与农业区划研究所,北京100081
  • 3. 中山大学广东省智能交通系统重点实验室,广州510275
  • 折叠

摘要

关键词

自动驾驶/端到端决策/深度强化学习/动作空间

分类

交通工程

引用本文复制引用

杨璐,王一权,刘佳琦,段玉林,张荣辉..基于融合离散动作的双延迟深度确定性策略梯度算法的自动驾驶端到端行为决策方法[J].交通信息与安全,2022,40(1):P.144-152,9.

基金项目

中国农业科学院国际农业科学计划项目(CAAS-ZDRW202107) (CAAS-ZDRW202107)

国家自然科学基金项目(52172350、51775565) (52172350、51775565)

天津市研究生科研创新项目(2020YJSZXS05)资助。 (2020YJSZXS05)

交通信息与安全

OA北大核心CSCDCSTPCD

1674-4861

访问量0
|
下载量0
段落导航相关论文