首页|期刊导航|物联网技术|多分支结构和双池化注意力机制的RetinaNet行人检测

多分支结构和双池化注意力机制的RetinaNet行人检测OA

中文摘要

行人检测技术结合行人跟踪和行为分析等技术,可广泛应用在交通、安防和机器交互等与人们生活息息相关的领域,但行人的多尺度变化一直是行人检测的难点.针对传统RetinaNet算法在多尺度行人检测过程中存在的误检、漏检和检测精度低等缺陷,提出一种改进的RetinaNet算法来提升网络模型的检测能力.主要有以下两方面创新:首先,为了获取到更多的语义信息,采用多分支结构来扩展网络,以提取不同深度下不同感受野的特征;其次,为了使模型更关注行人特征的重要信息,在模型预测头部分嵌入双池化注意力机制,增强通道间特征信息的相关性,抑制不重要的信息,以提高模型的检测精度.在COCO等不同的数据集上进行实验,结果表明,与传统的RetinaNet模型相比,所提出的模型在各个评价指标上均有所提升,具有良好的性能,可以满足行人检测的需要.

凌以运;王智文;白云;谢世步;韦秋伶;何雨鲜

广西科技大学 电子工程学院,广西 柳州 545006广西科技大学 电子工程学院,广西 柳州 545006柳州工学院 信息科学与工程学院,广西 柳州 545616广西科技大学 计算机科学与技术学院,广西 柳州 545006广西科技大学 电子工程学院,广西 柳州 545006广西科技大学 电子工程学院,广西 柳州 545006

计算机与自动化

行人检测RetinaNet多分支结构行人特征双池化注意力机制行人跟踪行为分析

《物联网技术》 2025 (1)

15-20,6

国家自然科学基金资助项目(61962007)大学生创新创业项目(202210594036)广西高校中青年教师科研基础能力提升项目(2022KY1697)广西高校中青年教师科研基础能力提升项目教育信息化专项(2022XXH0019)

10.16667/j.issn.2095-1302.2025.01.003

评论