图像-雷达融合的三维目标检测算法OA北大核心CSTPCD
针对多模态信息在三维空间融合过程中数据一致性和有效性的问题,提出鸟瞰视角(BEV)下图像与雷达融合的编码模块BEVIRF.与传统的透视视角下深度信息缺失的方案相比,本方法利用可变注意力的改进方案聚合图像和雷达信息,解决不同模态信息的统一表示问题,生成语义丰富且包含空间位置信息BEV特征图.同时在基于Transformer的网络结构中提出动态位置编码,旨在通过感知物体的空间信息来生成对应的位置编码,让模型专注于目标的回归,减少查询与匹配的不稳定性.所提出的方案在nuScenes数据集上取得了优秀结果.
蔡甘霖;陈锋;张森林
福州大学物理与信息工程学院,福建福州350108福州大学物理与信息工程学院,福建福州350108福州大学物理与信息工程学院,福建福州350108
计算机与自动化
三维目标检测卷积神经网络注意力机制BEV特征
《福州大学学报(自然科学版)》 2024 (6)
P.659-666,8
福建省自然科学基金面上资助项目(2022J01551)。
评论