| 注册
首页|期刊导航|计算机应用研究|DPC-DQRL:动态行为克隆约束的离线-在线双Q值强化学习

DPC-DQRL:动态行为克隆约束的离线-在线双Q值强化学习

闫雷鸣 刘健 朱永昕

计算机应用研究2025,Vol.42Issue(4):P.1003-1010,8.
计算机应用研究2025,Vol.42Issue(4):P.1003-1010,8.DOI:10.19734/j.issn.1001-3695.2024.09.0338

DPC-DQRL:动态行为克隆约束的离线-在线双Q值强化学习

闫雷鸣 1刘健 1朱永昕1

作者信息

  • 1. 南京信息工程大学计算机学院、网络空间安全学院,南京210044 南京信息工程大学数字取证教育部工程研究中心,南京210044
  • 折叠

摘要

关键词

深度强化学习/离线-在线强化学习/动态策略约束/Q值估计

分类

信息技术与安全科学

引用本文复制引用

闫雷鸣,刘健,朱永昕..DPC-DQRL:动态行为克隆约束的离线-在线双Q值强化学习[J].计算机应用研究,2025,42(4):P.1003-1010,8.

基金项目

国家自然科学基金资助项目(62172292,42375147)。 (62172292,42375147)

计算机应用研究

OA北大核心

1001-3695

访问量0
|
下载量0
段落导航相关论文