首页|期刊导航|交通信息与安全|基于融合离散动作的双延迟深度确定性策略梯度算法的自动驾驶端到端行为决策方法

基于融合离散动作的双延迟深度确定性策略梯度算法的自动驾驶端到端行为决策方法

杨璐王一权刘佳琦段玉林张荣辉

交通信息与安全2022，Vol.40Issue(1)：P.144-152,9.

杨璐 ¹王一权 ¹刘佳琦 ¹段玉林 ²张荣辉³

作者信息

自动驾驶/端到端决策/深度强化学习/动作空间

交通工程

杨璐,王一权,刘佳琦,段玉林,张荣辉..基于融合离散动作的双延迟深度确定性策略梯度算法的自动驾驶端到端行为决策方法[J].交通信息与安全,2022,40(1):P.144-152,9.

中国农业科学院国际农业科学计划项目(CAAS-ZDRW202107) （CAAS-ZDRW202107）

国家自然科学基金项目(52172350、51775565) （52172350、51775565）

天津市研究生科研创新项目(2020YJSZXS05)资助。（2020YJSZXS05）

OA北大核心CSCDCSTPCD

ISSN：1674-4861

访问量0

下载量0

段落导航