首页|期刊导航|高技术通讯|多视角解耦增强整合的细粒度分类算法

多视角解耦增强整合的细粒度分类算法OA北大核心CSTPCD

中文摘要

针对细粒度图像分类中由于背景环境、光照条件、样本姿态和拍摄角度等外部因素导致类内差异显著增加的问题,本文提出了多视角解耦增强整合的细粒度分类算法。首先,为了降低图像中外部因素的干扰,设计多视角注意力(MPA)模块,此模块通过将模型分解为数个视角,迫使每个视角关注不同尺度,实现干扰因素的解耦,并通过对特征进行自注意力建模,引导各个视角进一步挖掘关键特征。其次,提出递进式动态加权融合(PDWF)策略,旨在有效整合解耦后的多个视角信息,该策略通过获取不同视角下通道和空间关系动态调整融合系数,实现多尺度信息的高阶融合。最后,采用递进式训练方法促进视角交互,进一步捕获和整合多尺度特征的互补语义信息。在CUB-200-2011、StanfordCars、FGVC-Aircraft公开数据集上进行实验,实验结果表明所提方法分类准确率分别达到90.5%、95.5%和94.2%,优于当前细粒度图像分类任务主流方法。

孟月波;王博;刘光辉

西安建筑科技大学信息与控制工程学院,西安710055 西安市建筑制造智能化技术重点实验室,西安710055西安建筑科技大学信息与控制工程学院,西安710055 西安市建筑制造智能化技术重点实验室,西安710055西安建筑科技大学信息与控制工程学院,西安710055 西安市建筑制造智能化技术重点实验室,西安710055

计算机与自动化

细粒度多视角注意力(MPA)递进式动态加权融合(PDWF)图像分类

《高技术通讯》 2024 (12)

P.1266-1278,13

国家自然科学基金(52278125)资助项目。

10.3772/j.issn.1002-0470.2024.12.003

评论