控制理论与应用2023,Vol.40Issue(3):P.485-492,8.DOI:10.7641/CTA.2021.10552
基于自生成专家样本的探索增强算法
摘要
关键词
深度强化学习/探索/专家样本/确定性策略分类
信息技术与安全科学引用本文复制引用
刘健,赵恒一..基于自生成专家样本的探索增强算法[J].控制理论与应用,2023,40(3):P.485-492,8.基金项目
国家自然科学基金项目(61906198) (61906198)
江苏省自然科学基金项目(BK20190622)资助。 (BK20190622)