银行货币储备博弈的强化学习方法OA
在大规模银行交互系统中,各银行可通过控制与中央银行的借贷率来使自身对数货币储备尽可能地接近样本均值,从而降低系统性风险发生的概率.然而当状态过程与目标函数的参数未知时,无法直接求解随机微分博弈问题得到纳什均衡.本文结合平均场博弈理论与连续时间强化学习的相关方法,构造了一组大规模银行借贷网络中的近似纳什均衡.首先通过求解向前向后耦合HJB-FPK方程,得到代表银行的平均场均衡策略;再通过所得策略的形式,设计出迭代参数的方法用以刻画参数未知时的近似最优策略;最后通过学到的参数,构造银行数量较大时的近似纳什均衡.
李策
中国科学技术大学数学科学学院,安徽合肥230026
数学
系统性风险强化学习近似纳什均衡平均场博奔
《数学杂志》 2025 (1)
P.81-94,14
评论