首页|期刊导航|电子学报|弱标签声音事件检测的空间-通道特征表征与自注意池化

弱标签声音事件检测的空间-通道特征表征与自注意池化OACSTPCD

中文摘要

深度神经网络声音事件检测方法需要大量标记声音事件类别和起止时间的强标签音频样本,然而强标签标注非常困难和耗时.弱标签声音事件检测是解决这一困难的有效途径.本文将弱标签声音事件检测作为多实例学习问题,并基于卷积循环神经网络提出弱标签声音事件检测的空间-通道特征表征与自注意池化方法.该方法研究多实例弱标签声音事件检测的特征表征和帧级预测结果池化两个方面的内容.在特征表征方面,为了增强卷积神经网络的特征表征能力,结合上下文门控和通道注意机制构建门控注意力结构并嵌入到卷积循环神经网络中,实现了音频样本特征的空间和通道特征选择;在预测结果池化方面,引入自注意思想设计音频帧预测结果的自注意池化方法,增强了音频样本中事件帧之间的相关度,使事件帧获得更大的权重.本文方法通过对卷积循环神经网络特征表征和预测结果池化的革新,有效提升了模型的检测性能.本文提出的方法在DCASE 2017任务4和DCASE 2018任务4数据集的评估集中分别取得了52.47%和31.00%的F1得分,性能优于当前绝大部分的弱标签声音事件检测方法.实验结果表明:本文提出的空间-通道特征表征与自注意池化方法能显著改善弱标签声音事件检测的综合性能.

杨利平;侯振威;辜小花;郝峻永

重庆大学光电技术及系统教育部重点实验室,重庆400044重庆大学光电技术及系统教育部重点实验室,重庆400044重庆科技学院电气工程学院,重庆401331重庆大学光电技术及系统教育部重点实验室,重庆400044

计算机与自动化

特征表征自注意池化卷积循环神经网络弱标签学习声音事件检测

《电子学报》 2023 (2)

P.297-306,10

评论