基于CBAM-InceptionV3迁移学习的食品图像分类OA北大核心CSTPCD
为提高食品图像自动识别分类的准确率,提出一种嵌入通道注意力机制和空间注意力机制的卷积块注意力模块(CBAM)的“开端”第三版(Inception V3)分类模型。将带有图像网络(ImageNet)预训练权重参数的InceptionV3模型拆分后,在每个Inception块后嵌入CBAM模块,再重新组装成新模型,共嵌入11个CBAM模块。将此模型用于经过填充和缩放到299×299像素的Food-101食品图像数据集进行迁移学习,最高准确率达到82.01%。与原始的InceptionV3模型相比,CBAM模块能够有效提升模型的特征提取和分类能力;同时迁移学习与从头开始训练相比也可以大幅提高准确率、缩短训练时间。与其它几类主流卷积神经网络模型进行对比实验,结果表明该模型具有较高的识别准确率,可为食品图像分类识别提供有力支撑。
杜慧江;崔潇以;王艺蒙;孙丽萍;
上海健康医学院医疗器械学院,上海201318
计算机与自动化
食品图像分类通道注意力空间注意力CBAMInceptionV3迁移学习
《粮油食品科技》 2024 (001)
P.91-98 / 8
国家重点研发计划(2018YFB1307700)~~。
评论