| 注册
首页|期刊导航|吉林大学学报(信息科学版)|基于相关熵诱导度量的近端策略优化算法

基于相关熵诱导度量的近端策略优化算法

张会珍 王强

吉林大学学报(信息科学版)2023,Vol.41Issue(3):437-443,7.
吉林大学学报(信息科学版)2023,Vol.41Issue(3):437-443,7.

基于相关熵诱导度量的近端策略优化算法

Proximal Policy Optimization Algorithm Based on Correntropy Induced Metric

张会珍 1王强1

作者信息

  • 1. 东北石油大学电气信息工程学院,黑龙江大庆163318
  • 折叠

摘要

关键词

KL散度/近端策略优化(PPO)/相关熵诱导度量(CIM)/替代目标/深度强化学习

Key words

kullback-leibler(KL)divergence/proximal policy optimization(PPO)/correntropy induced metric(CIM)/alternative target/deep reinforcement learning

分类

信息技术与安全科学

引用本文复制引用

张会珍,王强..基于相关熵诱导度量的近端策略优化算法[J].吉林大学学报(信息科学版),2023,41(3):437-443,7.

基金项目

黑龙江省自然科学基金资助项目(F2018004) (F2018004)

吉林大学学报(信息科学版)

OACSTPCD

1671-5896

访问量10
|
下载量0
段落导航相关论文