| 注册
首页|期刊导航|指挥控制与仿真|全感知条件下基于奖励塑形的Q-learning算法及仿真

全感知条件下基于奖励塑形的Q-learning算法及仿真

陈嘉楠 彭军海 黄华

指挥控制与仿真2021,Vol.43Issue(5):60-65,6.
指挥控制与仿真2021,Vol.43Issue(5):60-65,6.DOI:10.3969/j.issn.1673-3819.2021.05.011

全感知条件下基于奖励塑形的Q-learning算法及仿真

Q-learning Algorithm and Simulation Based on Reward Shaping Under Comprehensive Recognition

陈嘉楠 1彭军海 2黄华2

作者信息

  • 1. 中国人民解放军91404部队,河北 秦皇岛 066000
  • 2. 江苏自动化研究所,江苏 连云港 222061
  • 折叠

摘要

关键词

强化学习/Q-learning/奖励塑形/全感知

分类

军事科技

引用本文复制引用

陈嘉楠,彭军海,黄华..全感知条件下基于奖励塑形的Q-learning算法及仿真[J].指挥控制与仿真,2021,43(5):60-65,6.

指挥控制与仿真

OACSTPCD

1673-3819

访问量0
|
下载量0
段落导航相关论文