自动化学报2022,Vol.48Issue(7):P.1816-1823,8.DOI:10.16383/j.aas.c190406
采用分类经验回放的深度确定性策略梯度方法
摘要
关键词
连续控制任务/深度确定性策略梯度/经验回放/分类经验回放分类
信息技术与安全科学引用本文复制引用
时圣苗,刘全..采用分类经验回放的深度确定性策略梯度方法[J].自动化学报,2022,48(7):P.1816-1823,8.基金项目
国家自然科学基金(61772355,61702055,61876217,62176175) (61772355,61702055,61876217,62176175)
江苏高校优势学科建设工程项目资助。 ()