广东工业大学学报2023,Vol.40Issue(4):9-17,23,10.DOI:10.12052/gdutxb.220122
改进判别式深度Dyna-Q的任务对话策略学习方法
A Task-oriented Dialogue Policy Learning Method of Improved Discriminative Deep Dyna-Q
摘要
关键词
任务型对话系统/对话策略学习/强化学习/用户模拟器Key words
task-oriented dialogue system/dialogue policy learning/reinforcement learning/user simulator分类
信息技术与安全科学引用本文复制引用
戴彬,曾碧,魏鹏飞,黄永健..改进判别式深度Dyna-Q的任务对话策略学习方法[J].广东工业大学学报,2023,40(4):9-17,23,10.基金项目
国家自然科学基金联合基金资助重点项目(U21A20478) (U21A20478)
广东省自然科学基金资助项目(2019A1515011056) (2019A1515011056)
顺德区核心技术攻关项目(2130218003002) (2130218003002)