残差混合注意力结合骨骼图卷积多人姿态识别OA北大核心CSTPCD
多人姿态识别研究起步晚,成熟度低,复杂性高,因此网络深度也随之加深,梯度消失问题也随之加剧,网络性能也随之衰减,由此造成识别精度差,识别效率低等共性问题.为解决这些问题,本文提出了一种残差混合注意力结合骨骼图卷积多人姿态识别模型.通过自顶向下的研究路径,运用预处理干预方式对多人体图像进行检测并对单人体坐标定位及框选标定,生成骨骼关键点架构图,借助残差块对网络结构进行改进以抑制梯度弥散,加载混合注意力机制对模型赋能增效.在MPII及MSCOCO2017两个数据集上对本文提出的模型进行了验证,结果显示该模型对多人姿态识别效果较好,在两个数据集上分布稳定,差异微小.同时,将本文模型与对本领域各类重要文献中记载模型综合能力进行了比较,结果表明在各项精细指标上本模型都有一定程度提升,稳定性较好,分布较为均匀.本文提出的多人姿态识别模型在跨数据集基础上表现出较好的识别效果和效率,为多人姿态识别的研究增添了动力.
陈斌;樊飞燕;陆天易
南京师范大学信息化建设管理处,江苏南京210023南京师范大学信息化建设管理处,江苏南京210023南京师范大学信息化建设管理处,江苏南京210023
计算机与自动化
多人姿态识别残差混合注意力机制骨骼关键点图图卷积
《南京师大学报(自然科学版)》 2024 (4)
P.106-117,12
江苏省现代教育技术研究2023年度智慧校园专项(2023-R-107311)。
评论