| 注册
首页|期刊导航|南京师范大学学报:工程技术版|基于UCB算法的交替深度Q网络

基于UCB算法的交替深度Q网络

吴卿源 谭晓阳

南京师范大学学报:工程技术版2022,Vol.22Issue(1):P.1-6,6.
南京师范大学学报:工程技术版2022,Vol.22Issue(1):P.1-6,6.DOI:10.3969/j.issn.1672-1292.2022.01.004

基于UCB算法的交替深度Q网络

吴卿源 1谭晓阳2

作者信息

  • 1. 南京航空航天大学计算机科学与技术学院,江苏南京211106
  • 2. 南京航空航天大学计算机科学与技术学院,江苏南京211106 南京航空航天大学模式分析与机器智能工业和信息化部重点实验室,江苏南京211106
  • 折叠

摘要

关键词

强化学习/深度强化学习/深度Q网络/最大置信度上界

分类

信息技术与安全科学

引用本文复制引用

吴卿源,谭晓阳..基于UCB算法的交替深度Q网络[J].南京师范大学学报:工程技术版,2022,22(1):P.1-6,6.

基金项目

科技创新2030重大项目(2021ZD0113203) (2021ZD0113203)

国家自然科学基金项目(61976115)。 (61976115)

南京师范大学学报:工程技术版

1672-1292

访问量0
|
下载量0
段落导航相关论文