计算机应用研究2020,Vol.37Issue(6):1626-1632,7.DOI:10.19734/j.issn.1001-3695.2018.12.0886
深度强化学习复原多目标航迹的TOC奖励函数
Design of TOC reward function in multi-target trajectory recovery with deep reinforcement learning
摘要
关键词
深度强化学习/序贯决策/Q函数/轨迹密切圆分类
信息技术与安全科学引用本文复制引用
贺亮,徐正国,贾愚,沈超,李赟..深度强化学习复原多目标航迹的TOC奖励函数[J].计算机应用研究,2020,37(6):1626-1632,7.基金项目
国家自然科学基金重点项目(U1736205) (U1736205)
国家自然科学基金资助项目(61773310) (61773310)