首页|期刊导航|传感技术学报|基于动态时间规整耦合3D运动历史图像的人体动作识别算法

基于动态时间规整耦合3D运动历史图像的人体动作识别算法OA北大核心CSTPCD

中文摘要

针对当前动作识别过程中忽略了场景的语义信息,易受视角变换与遮挡的影响,导致识别率不高等问题,提出了一种基于动态时间规整耦合3D运动历史图像的人体动作识别算法。首先,结合人体的空间位置、运动方向和速度等不同特征,利用多维最长公共子序列(Multi-Dimensional Longest Common Subsequence,MDLCS),对视频数据中的行人目标进行跟踪,提取目标的运动轨迹。然后,基于频谱映射理论,对得到的轨迹实施聚类,并计算运动轨迹的聚类中心。通过对聚类结果执行ROI划分和提取,获取场景的语义上下文信息。再引入动态时间规整(Dynamic Time Warping,DTW),将输入的视频序列与聚类中心进行比较,消除异常与冗余动作信息。随后,计算轨迹段的起点、终点与工作区的ROI之间的位置关系,结合场景的语义上下文信息,采用基于颜色和深度信息的3D运动历史图像(3D Motion History Image,3D-MHI)来提取动作特征。最后,利用支持向量机(Support Vector Machine,SVM)对3D-MHI动作特征进行分类学习,完成对人体动作的识别。实验表明:所提算法在UCF Sport与Hollywood数据集上的识别率分别达到了95.1%和92.5%,与当前流行的动作识别算法比较,具有更高的识别率与较强的鲁棒性,对视角变换与遮挡等复杂场景下的动作识别更为有效。

石峰;

太原学院计算机科学与技术系,山西太原030032

计算机与自动化

动作识别动态时间规整多维最长公共子序列频谱映射3D运动历史图像聚类中心

《传感技术学报》 2024 (011)

P.1937-1945 / 9

山西省高等学校改革创新项目基金项目(J20221192)。

10.3969/j.issn.1004-1699.2024.11.013

评论