南京师范大学学报:工程技术版2022,Vol.22Issue(1):P.1-6,6.DOI:10.3969/j.issn.1672-1292.2022.01.004
基于UCB算法的交替深度Q网络
摘要
关键词
强化学习/深度强化学习/深度Q网络/最大置信度上界分类
信息技术与安全科学引用本文复制引用
吴卿源,谭晓阳..基于UCB算法的交替深度Q网络[J].南京师范大学学报:工程技术版,2022,22(1):P.1-6,6.基金项目
科技创新2030重大项目(2021ZD0113203) (2021ZD0113203)
国家自然科学基金项目(61976115)。 (61976115)