计算机应用与软件2023,Vol.40Issue(5):184-189,226,7.DOI:10.3969/j.issn.1000-386x.2023.05.028
基于动作概率的强化学习动作探索策略
ACTION EXPLORATION STRATEGY OF REINFORCEMENT LEARNING BASED ON ACTION PROBABILITY
摘要
关键词
强化学习/探索与利用/探索策略/动作选择分类
信息技术与安全科学引用本文复制引用
于飞,郝建国,张中杰..基于动作概率的强化学习动作探索策略[J].计算机应用与软件,2023,40(5):184-189,226,7.基金项目
国家自然科学基金项目(61906202). (61906202)