首页|期刊导航|计算机应用与软件|基于动作概率的强化学习动作探索策略

基于动作概率的强化学习动作探索策略

于飞郝建国张中杰

计算机应用与软件2023，Vol.40Issue(5)：184-189,226,7.

计算机应用与软件2023，Vol.40Issue(5)：184-189,226,7.DOI:10.3969/j.issn.1000-386x.2023.05.028

ACTION EXPLORATION STRATEGY OF REINFORCEMENT LEARNING BASED ON ACTION PROBABILITY

于飞 ¹郝建国 ¹张中杰¹

作者信息

强化学习/探索与利用/探索策略/动作选择

信息技术与安全科学

于飞,郝建国,张中杰..基于动作概率的强化学习动作探索策略[J].计算机应用与软件,2023,40(5):184-189,226,7.

国家自然科学基金项目(61906202). （61906202）

OA北大核心CSTPCD

ISSN：1000-386X

访问量0

下载量0

段落导航