| 注册
首页|期刊导航|广东工业大学学报|改进判别式深度Dyna-Q的任务对话策略学习方法

改进判别式深度Dyna-Q的任务对话策略学习方法

戴彬 曾碧 魏鹏飞 黄永健

广东工业大学学报2023,Vol.40Issue(4):9-17,23,10.
广东工业大学学报2023,Vol.40Issue(4):9-17,23,10.DOI:10.12052/gdutxb.220122

改进判别式深度Dyna-Q的任务对话策略学习方法

A Task-oriented Dialogue Policy Learning Method of Improved Discriminative Deep Dyna-Q

戴彬 1曾碧 1魏鹏飞 1黄永健2

作者信息

  • 1. 广东工业大学 计算机学院,广东 广州 510006
  • 2. 广州轩辕研究院有限公司 广东 广州 510000
  • 折叠

摘要

关键词

任务型对话系统/对话策略学习/强化学习/用户模拟器

Key words

task-oriented dialogue system/dialogue policy learning/reinforcement learning/user simulator

分类

信息技术与安全科学

引用本文复制引用

戴彬,曾碧,魏鹏飞,黄永健..改进判别式深度Dyna-Q的任务对话策略学习方法[J].广东工业大学学报,2023,40(4):9-17,23,10.

基金项目

国家自然科学基金联合基金资助重点项目(U21A20478) (U21A20478)

广东省自然科学基金资助项目(2019A1515011056) (2019A1515011056)

顺德区核心技术攻关项目(2130218003002) (2130218003002)

广东工业大学学报

1007-7162

访问量0
|
下载量0
段落导航相关论文