首页|期刊导航|南京师范大学学报(工程技术版)|基于注意力机制与高分辨率网络的人体姿态估计

基于注意力机制与高分辨率网络的人体姿态估计OA

中文摘要

人体姿态估计旨在从图像或视频中精确识别关键点位置和姿态,对行为识别、人机交互等至关重要.高分辨率网络能够从图像中提取包含多尺度信息的人体关键点特征,但主要聚焦于图像局部范围内的特征信息,难以捕捉关节间的长距离依赖,因此易受复杂背景、遮挡等因素影响,限制了准确率.针对高分辨率网络在人体姿态估计中所面临的问题,提出了一种融合注意力机制和高分辨率网络的深度学习模块C2F-CBAM,该模块结合了C2F模块和CBAM模块的优势,结合先进的特征提取技术和强化的注意力机制,C2F-CBAM模块显著提高了模型在识别关键点的准确性.此外,将C2F-CBAM模块嵌入到HRNet网络的关键位置,使得该方法能够更好地整合和综合不同尺度的特征信息.这种融合策略不仅增强了模型对各种人体姿态和图像分辨率的适应性,还有效地处理了复杂背景和遮挡等问题.实验结果显示,该模型在COCO2017验证集上相较于其他方法具有显著优势,平均精度比传统HRNet网络提升了0.9,充分验证了模型的有效性和优越性.

张铭;李成龙;高新燕;王鹏飞;张金萧

山东建筑大学计算机科学与技术学院,山东济南250000山东建筑大学计算机科学与技术学院,山东济南250000山东华云三维科技有限公司,山东济南250000中建八局第二建设有限公司,山东济南250000山东建筑大学计算机科学与技术学院,山东济南250000

化学

人体姿态估计注意力机制高分辨率网络C2F-CBAM模块关键点检测

《南京师范大学学报(工程技术版)》 2024 (4)

P.46-56,11

国家自然科学基金项目(62102235)山东省自然科学基金项目(ZR2020QF029).

10.3969/j.issn.1672-1292.2024.04.005

评论