首页|期刊导航|自动化学报|基于Transformer的状态−动作−奖赏预测表征学习

基于Transformer的状态−动作−奖赏预测表征学习

刘民颂朱圆恒赵冬斌

自动化学报2025，Vol.51Issue(1)：P.117-132,16.

自动化学报2025，Vol.51Issue(1)：P.117-132,16.DOI:10.16383/j.aas.c240230

刘民颂 ¹朱圆恒 ¹赵冬斌¹

作者信息

深度强化学习/表征学习/自监督对比学习/Transformer

信息技术与安全科学

刘民颂,朱圆恒,赵冬斌..基于Transformer的状态−动作−奖赏预测表征学习[J].自动化学报,2025,51(1):P.117-132,16.

中国科学院战略性先导研究(XDA27030400) （XDA27030400）

国家自然科学基金(62136008,62293541) （62136008,62293541）

北京市自然科学基金(4232056)资助。（4232056）

OA北大核心

ISSN：0254-4156

访问量0

下载量0

段落导航