首页|期刊导航|广东工业大学学报|改进判别式深度Dyna-Q的任务对话策略学习方法

改进判别式深度Dyna-Q的任务对话策略学习方法

戴彬曾碧魏鹏飞黄永健

广东工业大学学报2023，Vol.40Issue(4)：9-17,23,10.

广东工业大学学报2023，Vol.40Issue(4)：9-17,23,10.DOI:10.12052/gdutxb.220122

A Task-oriented Dialogue Policy Learning Method of Improved Discriminative Deep Dyna-Q

戴彬 ¹曾碧 ¹魏鹏飞 ¹黄永健²

作者信息

任务型对话系统/对话策略学习/强化学习/用户模拟器

task-oriented dialogue system/dialogue policy learning/reinforcement learning/user simulator

信息技术与安全科学

戴彬,曾碧,魏鹏飞,黄永健..改进判别式深度Dyna-Q的任务对话策略学习方法[J].广东工业大学学报,2023,40(4):9-17,23,10.

国家自然科学基金联合基金资助重点项目(U21A20478) （U21A20478）

广东省自然科学基金资助项目(2019A1515011056) （2019A1515011056）

顺德区核心技术攻关项目(2130218003002) （2130218003002）

ISSN：1007-7162

访问量0

下载量0

段落导航