基于平行全维动态注意力机制的视觉地点识别方法OA北大核心CSTPCD
针对天气、季节、光线等环境变化导致的视觉地点识别鲁棒性低的问题,提出了一种提升视觉地点识别特征描述子环境稳健性的多维度注意力机制——平行全维动态注意力机制(POD-Attention)。为实现卷积核在全维度上的动态精细探索,增强特征提取网络对建筑物等不变性特征的提取与学习能力,采用全维动态卷积块在卷积核全维度(输入输出通道、卷积空间和卷积核数量)上添加互补性注意力。将1×1卷积、Skip Squeeze-and-Excitation(SSE)模块与全维动态卷积块平行融合,不仅有效提高了特征提取速率,还扩大了视觉地点识别网络的感受野,进一步提升了视觉地点的识别准确率。在公开数据集上进行的实验表明,基于VGG16及Patch-NetVLAD特征聚合的视觉地点识别方法经POD注意力机制改进后,在Nordland与Mapillary Street-Level Sequences数据集上的Recall@1指标提升了9.7%与1.8%,充分证明了本文POD注意力机制对于网络性能的提升效果,也证明了基于本文POD注意力机制的视觉地点识别方法的有效性。
刘沛津;刘淑婕;何林;彭莉峻;付雪峰;
西安建筑科技大学机电工程学院,陕西西安710055西安建筑科技大学理学院,陕西西安710055
计算机与自动化
视觉地点识别环境鲁棒性深度学习平行全维动态注意力机制平行策略
《液晶与显示》 2024 (009)
P.1233-1242 / 10
陕西省重点研发计划(No.2022GY-134);陕西省教育厅专项科研项目(No.21JK0732);西安建筑科技大学自然科学专项(No.ZR19058)。
评论