| 注册
首页|期刊导航|计算机应用与软件|基于动作概率的强化学习动作探索策略

基于动作概率的强化学习动作探索策略

于飞 郝建国 张中杰

计算机应用与软件2023,Vol.40Issue(5):184-189,226,7.
计算机应用与软件2023,Vol.40Issue(5):184-189,226,7.DOI:10.3969/j.issn.1000-386x.2023.05.028

基于动作概率的强化学习动作探索策略

ACTION EXPLORATION STRATEGY OF REINFORCEMENT LEARNING BASED ON ACTION PROBABILITY

于飞 1郝建国 1张中杰1

作者信息

  • 1. 国防科技大学智能科学学院 湖南 长沙 410005
  • 折叠

摘要

关键词

强化学习/探索与利用/探索策略/动作选择

分类

信息技术与安全科学

引用本文复制引用

于飞,郝建国,张中杰..基于动作概率的强化学习动作探索策略[J].计算机应用与软件,2023,40(5):184-189,226,7.

基金项目

国家自然科学基金项目(61906202). (61906202)

计算机应用与软件

OA北大核心CSTPCD

1000-386X

访问量0
|
下载量0
段落导航相关论文