UMTransNet:结合U-Net和多尺度感知Transformer的图像拼接定位方法OA北大核心
当前基于深度学习的图像拼接定位方法大多只关注深层次特征,且感受野有限,忽略了浅层次特征,影响图像拼接定位的准确性。针对上述问题,文中提出一种结合改进U-Net和多尺度多视角Transformer的图像拼接定位网络UMTransNet。改进U-Net模型的编码器,将编码器中的最大池化层替换成卷积层,防止浅层次特征的流失;将多尺度多视角Transformer嵌入到U-Net的跳跃连接中,Transformer的输出特征与U-Net的上采样特征进行有效融合,实现深层次特征与浅层次特征的平衡,从而提高图像拼接定位的准确性。通过可视化检测结果图显示,所提方法在定位拼接篡改区域方面表现得更加出色。
张维;何月顺;谢浩浩;杨安博;杨超文;吕熊;
东华理工大学信息工程学院,江西南昌330013
电子信息工程
数字图像取证图像拼接定位U-Net多尺度感知自注意力机制交叉注意力机制
《现代电子技术》 2025 (001)
P.33-39 / 7
江西省科技计划项目(20232ABC03A09)。
评论