首页|期刊导航|计算机应用研究|深度强化学习复原多目标航迹的TOC奖励函数

深度强化学习复原多目标航迹的TOC奖励函数

贺亮徐正国贾愚沈超李赟

计算机应用研究2020，Vol.37Issue(6)：1626-1632,7.

计算机应用研究2020，Vol.37Issue(6)：1626-1632,7.DOI:10.19734/j.issn.1001-3695.2018.12.0886

Design of TOC reward function in multi-target trajectory recovery with deep reinforcement learning

贺亮 ¹徐正国 ¹贾愚 ¹沈超 ²李赟¹

作者信息

深度强化学习/序贯决策/Q函数/轨迹密切圆

信息技术与安全科学

贺亮,徐正国,贾愚,沈超,李赟..深度强化学习复原多目标航迹的TOC奖励函数[J].计算机应用研究,2020,37(6):1626-1632,7.

国家自然科学基金重点项目(U1736205) （U1736205）

国家自然科学基金资助项目(61773310) （61773310）

OA北大核心CSCDCSTPCD

ISSN：1001-3695

访问量0

下载量0

段落导航