首页|期刊导航|现代电子技术|基于SE注意力机制和深度卷积的语音情感识别

基于SE注意力机制和深度卷积的语音情感识别OA北大核心CSTPCD

中文摘要

针对语音情感识别无法全面提取语音中的情感特征,导致识别准确率低的问题,提出一种基于SE注意力机制和深度卷积的双通道网络模型。首先利用速度增强对原始数据集进行数据扩增,选取Mel谱图、一阶差分、二阶差分混合特征图作为输入,以获得更全面的语音信号特征;然后在SE注意力机制通道前后添加Ghost卷积提取局部特征,在深度卷积通道前后引入卷积层和逐点卷积提取全局特征,通过特征融合层融合特征;最后利用指数型下降进行训练识别。结果表明,所提模型在扩增后的中文数…查看全部>>

张少华;冯炎;余仁杰;邢沛然;任艺昊

西藏大学信息科学技术学院,西藏拉萨850000西藏大学信息科学技术学院,西藏拉萨850000西藏大学信息科学技术学院,西藏拉萨850000西藏大学信息科学技术学院,西藏拉萨850000西藏大学信息科学技术学院,西藏拉萨850000

电子信息工程

语音情感识别双通道SE注意力机制数据扩增Ghost卷积深度卷积逐点卷积特征融合

《现代电子技术》 2024 (22)

P.64-70,7

10.16652/j.issn.1004-373x.2024.22.011

评论

您当前未登录!去登录点击加载更多...