计算机工程与应用2020,Vol.56Issue(18):137-142,6.DOI:10.3778/j.issn.1002-8331.1906-0175
基于残差梯度法的神经网络Q学习算法
Neural Network Q Learning Algorithm Based on Residual Gradient Method
摘要
关键词
Q学习/神经网络/值函数近似/残差梯度法/经验回放分类
信息技术与安全科学引用本文复制引用
司彦娜,普杰信,臧绍飞..基于残差梯度法的神经网络Q学习算法[J].计算机工程与应用,2020,56(18):137-142,6.基金项目
国家自然科学基金(No.U1504610). (No.U1504610)