首页|期刊导航|指挥控制与仿真|基于数据增广的声学场景分类

基于数据增广的声学场景分类OACSTPCD

Acoustic Scene Classification Based on Data Augment Technology

中文摘要

声学场景分类是计算机听觉领域的热点方向之一,相比计算机视觉,特定场景下音频数据的收集和标注成本相对较高,如何利用有限的声学场景音频获得较高的分类准确率成为当前研究的重点内容.利用深度学习技术,结合轻量化网络模型mobilenetv2以及Mel声谱特征,基于城市场景分类数据集(urbansound8k)对三种数据增广技术SpecAugment、Mixup以及Cutmix进行全面的消融实验,结果表明:Cutmix增广技术将基线结果提升了0.71%,单…查看全部>>

李源;马成男;李关防;王强;张文武

海装重大专项装备项目管理中心, 北京 100071江苏自动化研究所, 江苏 连云港 222061江苏自动化研究所, 江苏 连云港 222061江苏自动化研究所, 江苏 连云港 222061江苏自动化研究所, 江苏 连云港 222061

信息技术与安全科学

声学场景分类数据增广SpecAugmentMixupCutmix

《指挥控制与仿真》 2021 (1)

60-64,5

10.3969/j.issn.1673-3819.2021.01.011

评论

您当前未登录!去登录点击加载更多...