基于深度残差收缩网络多特征融合语音情感识别OA北大核心CSTPCD
Multi?feature Fusion Speech Emotion Recognition Based on Deep Residual Shrink?age Network
针对语音情感识别任务中说话者的差异性,计算谱特征的一阶差分、二阶差分组成三通道的特征集输入二维网络.结合卷积神经网络、双向长短时记忆网络以及注意力机制建立基线模型,引入深度残差收缩网络分配二维网络中的通道权重,进一步提高语音情感识别的精度.为提升模型的学习效果,采取特征层融合(特征向量并行和特征向量拼接两种方式)和决策层融合(平均得分和最大得分两种方式)等不同信息融合机制.结果表明:(1)特征层融合中的特征向量并行策略是更有效的方式;(2)本文提…查看全部>>
李瑞航;吴红兰;孙有朝;吴华聪
南京航空航天大学民航学院,南京211106南京航空航天大学民航学院,南京211106南京航空航天大学民航学院,南京211106南京航空航天大学民航学院,南京211106
信息技术与安全科学
深度学习语音情感识别深度残差收缩网络注意力机制多特征融合
《数据采集与处理》 2022 (3)
民机驾驶舱人机智能交互安全风险评估技术与方法研究
542-554,13
国家自然科学基金(U2033202,52172387,U1333119).
评论