| 注册
首页|期刊导航|天津科技大学学报|基于有效动作表示的策略搜索强化学习方法

基于有效动作表示的策略搜索强化学习方法

王馨雪 黄佳欣 赵婷婷 陈亚瑞 王嫄

天津科技大学学报2025,Vol.40Issue(5):P.57-65,9.
天津科技大学学报2025,Vol.40Issue(5):P.57-65,9.DOI:10.13364/j.issn.1672-6510.20240002

基于有效动作表示的策略搜索强化学习方法

王馨雪 1黄佳欣 1赵婷婷 1陈亚瑞 1王嫄1

作者信息

  • 1. 天津科技大学人工智能学院,天津300457
  • 折叠

摘要

关键词

潜在空间/动作表示/连续动作空间/回报预测/有效动作表示提取器/策略搜索强化学习方法

分类

信息技术与安全科学

引用本文复制引用

王馨雪,黄佳欣,赵婷婷,陈亚瑞,王嫄..基于有效动作表示的策略搜索强化学习方法[J].天津科技大学学报,2025,40(5):P.57-65,9.

基金项目

国家自然科学基金资助项目(61976156)。 (61976156)

天津科技大学学报

1672-6510

访问量0
|
下载量0
段落导航相关论文