| 注册
首页|期刊导航|计算机应用研究|深度强化学习复原多目标航迹的TOC奖励函数

深度强化学习复原多目标航迹的TOC奖励函数

贺亮 徐正国 贾愚 沈超 李赟

计算机应用研究2020,Vol.37Issue(6):1626-1632,7.
计算机应用研究2020,Vol.37Issue(6):1626-1632,7.DOI:10.19734/j.issn.1001-3695.2018.12.0886

深度强化学习复原多目标航迹的TOC奖励函数

Design of TOC reward function in multi-target trajectory recovery with deep reinforcement learning

贺亮 1徐正国 1贾愚 1沈超 2李赟1

作者信息

  • 1. 盲信号处理重点实验室,成都 610041
  • 2. 西安交通大学 智能网络与网络安全教育部重点实验室,西安710049
  • 折叠

摘要

关键词

深度强化学习/序贯决策/Q函数/轨迹密切圆

分类

信息技术与安全科学

引用本文复制引用

贺亮,徐正国,贾愚,沈超,李赟..深度强化学习复原多目标航迹的TOC奖励函数[J].计算机应用研究,2020,37(6):1626-1632,7.

基金项目

国家自然科学基金重点项目(U1736205) (U1736205)

国家自然科学基金资助项目(61773310) (61773310)

计算机应用研究

OA北大核心CSCDCSTPCD

1001-3695

访问量0
|
下载量0
段落导航相关论文