首页|期刊导航|智能系统学报|深度强化学习中状态注意力机制的研究

深度强化学习中状态注意力机制的研究OA北大核心CSCDCSTPCD

State attention in deep reinforcement learning

中文摘要

虽然在深度学习与强化学习结合后,人工智能在棋类游戏和视频游戏等领域取得了超越人类水平的重大成就,但是实时策略性游戏星际争霸由于其巨大的状态空间和动作空间,对于人工智能研究者来说是一个巨大的挑战平台,针对Deepmind在星际争霸Ⅱ迷你游戏中利用经典的深度强化学习算法A3C训练出来的基线智能体的水平和普通业余玩家的水平相比还存在较大的差距的问题.通过采用更简化的网络结构以及把注意力机制与强化学习中的奖励结合起来的方法,提出基于状态注意力的A3C算法…查看全部>>

作者：申翔翔;侯新文;尹传环

作者单位：北京交通大学交通数据分析与挖掘北京市重点实验室,北京100044中国科学院自动化研究所智能系统与工程研究中心,北京110016北京交通大学交通数据分析与挖掘北京市重点实验室,北京100044

分类：信息技术与安全科学

中文关键词：深度学习强化学习注意力机制A3C算法星际争霸Ⅱ迷你游戏智能体微型操作

刊名：《智能系统学报》 2020 (2)

相关项目：多核支持向量机的研究及其在云安全中的应用

页码/页数：317-322,6

基金：中央高校基本科研业务费专项资金项目(2018JBZ006)国家自然科学基金项目(61105056).

DOI：10.11992/tis.201809033

您当前未登录！

去登录

点击加载更多...

深度强化学习中状态注意力机制的研究OA北大核心CSCDCSTPCD

State attention in deep reinforcement learning

评论