天津科技大学学报2025,Vol.40Issue(5):P.57-65,9.DOI:10.13364/j.issn.1672-6510.20240002
基于有效动作表示的策略搜索强化学习方法
摘要
关键词
潜在空间/动作表示/连续动作空间/回报预测/有效动作表示提取器/策略搜索强化学习方法分类
信息技术与安全科学引用本文复制引用
王馨雪,黄佳欣,赵婷婷,陈亚瑞,王嫄..基于有效动作表示的策略搜索强化学习方法[J].天津科技大学学报,2025,40(5):P.57-65,9.基金项目
国家自然科学基金资助项目(61976156)。 (61976156)