计算机应用研究2025,Vol.42Issue(4):P.1003-1010,8.DOI:10.19734/j.issn.1001-3695.2024.09.0338
DPC-DQRL:动态行为克隆约束的离线-在线双Q值强化学习
摘要
关键词
深度强化学习/离线-在线强化学习/动态策略约束/Q值估计分类
信息技术与安全科学引用本文复制引用
闫雷鸣,刘健,朱永昕..DPC-DQRL:动态行为克隆约束的离线-在线双Q值强化学习[J].计算机应用研究,2025,42(4):P.1003-1010,8.基金项目
国家自然科学基金资助项目(62172292,42375147)。 (62172292,42375147)