首页|期刊导航|数据采集与处理|基于深度残差收缩网络多特征融合语音情感识别

基于深度残差收缩网络多特征融合语音情感识别OA北大核心CSTPCD

Multi?feature Fusion Speech Emotion Recognition Based on Deep Residual Shrink?age Network

中文摘要

针对语音情感识别任务中说话者的差异性,计算谱特征的一阶差分、二阶差分组成三通道的特征集输入二维网络.结合卷积神经网络、双向长短时记忆网络以及注意力机制建立基线模型,引入深度残差收缩网络分配二维网络中的通道权重,进一步提高语音情感识别的精度.为提升模型的学习效果,采取特征层融合(特征向量并行和特征向量拼接两种方式)和决策层融合(平均得分和最大得分两种方式)等不同信息融合机制.结果表明:(1)特征层融合中的特征向量并行策略是更有效的方式;(2)本文提…查看全部>>

作者：李瑞航;吴红兰;孙有朝;吴华聪

作者单位：南京航空航天大学民航学院,南京211106南京航空航天大学民航学院,南京211106南京航空航天大学民航学院,南京211106南京航空航天大学民航学院,南京211106

分类：信息技术与安全科学

中文关键词：深度学习语音情感识别深度残差收缩网络注意力机制多特征融合

刊名：《数据采集与处理》 2022 (3)

相关项目：民机驾驶舱人机智能交互安全风险评估技术与方法研究

页码/页数：542-554,13

基金：国家自然科学基金(U2033202,52172387,U1333119).

DOI：10.16337/j.1004‑9037.2022.03.005

您当前未登录！

去登录

点击加载更多...

基于深度残差收缩网络多特征融合语音情感识别OA北大核心CSTPCD

Multi?feature Fusion Speech Emotion Recognition Based on Deep Residual Shrink?age Network

评论