一种多尺度前向注意力模型的语音识别方法OA北大核心CSCDCSTPCD
A Method of Multi-Scale Forward Attention Model for Speech Recognition
注意力模型是当前语音识别中的主流模型,然而其存在一个缺点,即当前时刻的注意力模型可能产生异常得分.为此,本文首先提出前向注意力模型,其采用上一时刻正常注意力得分平滑当前时刻异常得分.接着通过对上一时刻的注意力得分添加约束因子来对前向注意力模型进行优化,达到自适应平滑的目的.最后,在优化模型基础上提出多尺度前向注意力模型,其通过引入多尺度模型来对不同等级的语音基元进行建模,进而将所得到的不同等级目标向量进行融合,以达到解决注意力得分异常值的目的.采用SwitchBoard作为训练集,Hub5'00作为测试集进行实验,相比于基线系统,多尺度前向注意力模型的词错误率(Word Error Rate,WER)相对降低14.28%.
唐海桃;薛嘉宾;韩纪庆
哈尔滨工业大学计算机科学与技术学院,黑龙江哈尔滨 150001哈尔滨工业大学计算机科学与技术学院,黑龙江哈尔滨 150001哈尔滨工业大学计算机科学与技术学院,黑龙江哈尔滨 150001
信息技术与安全科学
前向注意力机制自适应平滑多尺度语音识别
《电子学报》 2020 (7)
1255-1260,6
国家重点研发项目(No.2017YFB1002102)
评论