基于改进卷积注意力机制的触觉图像识别OA北大核心CSTPCD
为了改善传统轻量化网络对触觉图像全局特征提取能力差的问题,提出一种基于轻量化网络提高触觉图像感知分类的新算法,通过将卷积块注意力模块(CBAM)引入坐标注意力机制(CA)来增强特征信息表达能力.利用CA采取空间全局信息并嵌入通道注意中,使卷积网络能够在较全面的区域捕获注意力权重.结果表明:所提算法优于现有轻量化网络算法;该算法对GelSight数据集、多模态传感器数据集2种触觉图像进行分类识别测试,在分类表现中分辨正确率分别达到了88.2%和94.4%;相比于传统的CBAM注意力模型、自注意力模型(SENet)和仅有LeNet的神经网络,该算法对触觉图像的识别能力在GelSight数据集上分别提高了8.7%、8.7%和3.0%,在多模态传感器数据集上分别提高了13.3%、13.4%和4.8%.
熊鹏文;陈志远;廖俊杰;宋爱国;
南昌大学信息工程学院,南昌330031 南昌大学机器人研究所,南昌330031东南大学仪器科学与工程学院,南京210096
计算机与自动化
触觉图像轻量化注意力机制坐标注意力
《东南大学学报(自然科学版)》 2024 (001)
P.175-182 / 8
国家自然科学基金资助项目(62163024,62373181,61903175,61663027);江西省“双千计划”资助项目(jxsq2023201097);江西省杰出青年基金资助项目(20232ACB212002);江西省主要学科学术与技术带头人资助项目(20204BCJ23006);国家重点研发计划“智能机器人”重点专项资助项目(2023YFB4704903)。
评论