| 注册
首页|期刊导航|计算机工程与应用|基于残差梯度法的神经网络Q学习算法

基于残差梯度法的神经网络Q学习算法

司彦娜 普杰信 臧绍飞

计算机工程与应用2020,Vol.56Issue(18):137-142,6.
计算机工程与应用2020,Vol.56Issue(18):137-142,6.DOI:10.3778/j.issn.1002-8331.1906-0175

基于残差梯度法的神经网络Q学习算法

Neural Network Q Learning Algorithm Based on Residual Gradient Method

司彦娜 1普杰信 1臧绍飞1

作者信息

  • 1. 河南科技大学 信息工程学院,河南 洛阳 471023
  • 折叠

摘要

关键词

Q学习/神经网络/值函数近似/残差梯度法/经验回放

分类

信息技术与安全科学

引用本文复制引用

司彦娜,普杰信,臧绍飞..基于残差梯度法的神经网络Q学习算法[J].计算机工程与应用,2020,56(18):137-142,6.

基金项目

国家自然科学基金(No.U1504610). (No.U1504610)

计算机工程与应用

OA北大核心CSCDCSTPCD

1002-8331

访问量0
|
下载量0
段落导航相关论文