指挥控制与仿真2021,Vol.43Issue(5):60-65,6.DOI:10.3969/j.issn.1673-3819.2021.05.011
全感知条件下基于奖励塑形的Q-learning算法及仿真
Q-learning Algorithm and Simulation Based on Reward Shaping Under Comprehensive Recognition
陈嘉楠 1彭军海 2黄华2
作者信息
- 1. 中国人民解放军91404部队,河北 秦皇岛 066000
- 2. 江苏自动化研究所,江苏 连云港 222061
- 折叠
摘要
关键词
强化学习/Q-learning/奖励塑形/全感知分类
军事科技引用本文复制引用
陈嘉楠,彭军海,黄华..全感知条件下基于奖励塑形的Q-learning算法及仿真[J].指挥控制与仿真,2021,43(5):60-65,6.