| 注册
首页|期刊导航|通信学报|基于值函数迁移的启发式Sarsa算法

基于值函数迁移的启发式Sarsa算法

陈建平 杨正霞 刘全 吴宏杰 徐杨 傅启明

通信学报2018,Vol.39Issue(8):37-47,11.
通信学报2018,Vol.39Issue(8):37-47,11.DOI:10.11959/j.issn.1000-436x.2018133

基于值函数迁移的启发式Sarsa算法

Heuristic Sarsa algorithm based on value function transfer

陈建平 1杨正霞 2刘全 3吴宏杰 1徐杨 2傅启明3

作者信息

  • 1. 苏州科技大学电子与信息工程学院,江苏苏州 215009
  • 2. 苏州科技大学江苏省建筑智慧节能重点实验室,江苏苏州 215009
  • 3. 苏州科技大学苏州市移动网络技术与应用重点实验室,江苏苏州 215009
  • 折叠

摘要

关键词

强化学习/值函数迁移/自模拟度量/变分贝叶斯

分类

信息技术与安全科学

引用本文复制引用

陈建平,杨正霞,刘全,吴宏杰,徐杨,傅启明..基于值函数迁移的启发式Sarsa算法[J].通信学报,2018,39(8):37-47,11.

基金项目

国家自然科学基金资助项目(No.61502329, No.61772357, No.61750110519, No.61772355, No.61702055, No.61672371, No.61602334) (No.61502329, No.61772357, No.61750110519, No.61772355, No.61702055, No.61672371, No.61602334)

江苏省自然科学基金资助项目(No.BK20140283) (No.BK20140283)

江苏省重点研发计划基金资助项目(No.BE2017663) (No.BE2017663)

江苏省高校自然科学基金资助项目(No.13KJB520020) (No.13KJB520020)

苏州市应用基础研究计划工业部分基金资助项目(No.SYG201422) (No.SYG201422)

通信学报

OA北大核心CSCDCSTPCD

1000-436X

访问量0
|
下载量0
段落导航相关论文