基于预训练模型的单帧航拍图像无监督语义分割OA
针对航拍图像语义分割成本高、通用性差和精度低等问题,提出了一种两阶段无监督语义分割网络(two-stage unsupervised semantic segmentation net, TUSSNet),针对单帧航拍图像训练进而生成最终的语义分割结果。算法分为2个阶段。首先,使用对比语言-图像预训练(contrastive language-image pretraining, CLIP)模型生成航拍图像的粗粒度语义标签,然后进行网络的预热训练。其次,在第一阶段的基础上,采用分割一切模型(segment anything model, SAM)对航拍图像进行细粒度类别预测,生成精细化类别掩码伪标签;然后迭代优化网络,得到最终语义分割结果。实验结果显示,相较于现有无监督语义分割方法,算法显著提高了航拍图像的分割精度,同时提供了准确的语义信息。
任月冬;游新冬;滕尚志;吕学强;
北京信息科技大学网络文化与数字传播北京市重点实验室,北京100101
计算机与自动化
预训练模型航拍图像语义分割无监督算法聚类效果估计深度学习
《北京信息科技大学学报(自然科学版)》 2024 (002)
P.21-28 / 8
国家自然科学基金项目(62202061;62171043);北京市自然科学基金项目(4232025);北京市教委科研计划科技一般项目(KM202311232002)。
评论