首页|期刊导航|数据采集与处理|基于深度残差收缩网络多特征融合语音情感识别

基于深度残差收缩网络多特征融合语音情感识别OA北大核心CSTPCD

Multi?feature Fusion Speech Emotion Recognition Based on Deep Residual Shrink?age Network

中文摘要

针对语音情感识别任务中说话者的差异性,计算谱特征的一阶差分、二阶差分组成三通道的特征集输入二维网络.结合卷积神经网络、双向长短时记忆网络以及注意力机制建立基线模型,引入深度残差收缩网络分配二维网络中的通道权重,进一步提高语音情感识别的精度.为提升模型的学习效果,采取特征层融合(特征向量并行和特征向量拼接两种方式)和决策层融合(平均得分和最大得分两种方式)等不同信息融合机制.结果表明:(1)特征层融合中的特征向量并行策略是更有效的方式;(2)本文提…查看全部>>

李瑞航;吴红兰;孙有朝;吴华聪

南京航空航天大学民航学院,南京211106南京航空航天大学民航学院,南京211106南京航空航天大学民航学院,南京211106南京航空航天大学民航学院,南京211106

信息技术与安全科学

深度学习语音情感识别深度残差收缩网络注意力机制多特征融合

《数据采集与处理》 2022 (3)

民机驾驶舱人机智能交互安全风险评估技术与方法研究

542-554,13

国家自然科学基金(U2033202,52172387,U1333119).

10.16337/j.1004‑9037.2022.03.005

评论

您当前未登录!去登录点击加载更多...