计算机工程与应用2021,Vol.57Issue(12):237-242,6.DOI:10.3778/j.issn.1002-8331.2003-0382
考虑时变奖励的多摇臂算法在动态定价中的应用
Application of Multi-armed Bandit Algorithm with Time-Varying Rewardsin Dynamic Pricing
摘要
关键词
多摇臂算法/动态定价/置信区间上界算法分类
管理科学引用本文复制引用
乔勋双,毕文杰..考虑时变奖励的多摇臂算法在动态定价中的应用[J].计算机工程与应用,2021,57(12):237-242,6.基金项目
国家自然科学基金重大研究计划-培育项目(91646115). (91646115)