首页|期刊导航|计算机应用研究|DPC-DQRL:动态行为克隆约束的离线-在线双Q值强化学习

DPC-DQRL:动态行为克隆约束的离线-在线双Q值强化学习

闫雷鸣刘健朱永昕

计算机应用研究2025，Vol.42Issue(4)：P.1003-1010,8.

计算机应用研究2025，Vol.42Issue(4)：P.1003-1010,8.DOI:10.19734/j.issn.1001-3695.2024.09.0338

闫雷鸣 ¹刘健 ¹朱永昕¹

作者信息

深度强化学习/离线-在线强化学习/动态策略约束/Q值估计

信息技术与安全科学

闫雷鸣,刘健,朱永昕..DPC-DQRL:动态行为克隆约束的离线-在线双Q值强化学习[J].计算机应用研究,2025,42(4):P.1003-1010,8.

国家自然科学基金资助项目(62172292,42375147)。（62172292,42375147）

OA北大核心

ISSN：1001-3695

访问量12

下载量0

段落导航