首页|期刊导航|计算机应用研究|混合CTC/attention架构端到端带口音普通话识别

混合CTC/attention架构端到端带口音普通话识别OA北大核心CSCDCSTPCD

Hybrid CTC/attention architecture for end-to-end multi-accent Mandarin speech recognition

中文摘要

针对普通话语音识别任务中的多口音识别问题,提出了链接时序主义(connectionist temporal classifica-tion,CTC)和多头注意力(multi-head attention)的混合端到端模型,同时采用多目标训练和联合解码的方法.实验分析发现随着混合架构中链接时序主义权重的降低和编码器层数的加深,混合模型在带口音的数据集上表现出了更好的学习能力,同时训练一个深度达到48层的编码器—解码器架构的网络,生成模型的表现超过之…查看全部>>

作者：杨威;胡燕

作者单位：武汉理工大学计算机科学与技术学院,武汉430000武汉理工大学计算机科学与技术学院,武汉430000

分类：信息技术与安全科学

中文关键词：口音混合CTC/attention的端到端模型多头注意力链接时序主义语音识别

刊名：《计算机应用研究》 2021 (3)

页码/页数：755-759,5

基金：湖北省自然科学基金资助项目(2019CFC919)

DOI：10.19734/j.issn.1001-3695.2020.02.0036

您当前未登录！

去登录

点击加载更多...

混合CTC/attention架构端到端带口音普通话识别OA北大核心CSCDCSTPCD

Hybrid CTC/attention architecture for end-to-end multi-accent Mandarin speech recognition

评论