细粒度图像分类上Vision Transformer的发展综述OA北大核心CSTPCD
Survey of Vision Transformer in Fine-Grained Image Classification
细粒度图像分类(fine-grained image classification,FGIC)一直是计算机视觉领域中的重要问题.与传统图像分类任务相比,FGIC的挑战在于类间对象极其相似,使任务难度进一步增加.随着深度学习的发展,Vision Transformer(ViT)模型在视觉领域掀起热潮,并被引入到FGIC任务中.介绍了FGIC任务所面临的挑战,分析了ViT模型及其特性.主要根据模型结构全面综述了基于ViT的FGIC算法,包括特征提取、…查看全部>>
Fine-grained image classification(FGIC)has always been an important problem in computer vision.Compared to traditional image classification tasks,FGIC faces the challenge of extremely similar inter-class objects,which further increases the difficulty of the task.With the development of deep learning,Vision Transformer(ViT)models have become popular in the field of vision and have been introduced into FGIC tasks.This paper introduces the challenges face…查看全部>>
孙露露;刘建平;王健;邢嘉璐;张越;王晨阳
北方民族大学 计算机科学与工程学院,银川 750021北方民族大学 计算机科学与工程学院,银川 750021||北方民族大学 图像图形智能处理国家民委重点实验室,银川 750021中国农业科学院 农业信息研究所,北京 100081北方民族大学 计算机科学与工程学院,银川 750021北方民族大学 计算机科学与工程学院,银川 750021北方民族大学 计算机科学与工程学院,银川 750021
计算机与自动化
细粒度图像分类Vision Transformer特征提取特征关系构建特征注意特征增强
fine-grained image classificationVision Transformerfeature extractionfeature relation modelingfeature attentionfeature enhancement
《计算机工程与应用》 2024 (10)
30-46,17
宁夏重点研发计划(引才专项)(2022BSB03044)宁夏自然科学基金(2021AAC03205)北方民族大学科研启动金项目(2020KYQD37)北方民族大学研究生创新项目(YCX23168).
评论