基于截断技术的鲁棒模糊C均值聚类OA北大核心CSTPCD
[目的]直接利用模糊C均值(FCM)对原始数据进行聚类,容易导致聚类结果受到噪声和离群点的影响,但通常利用松弛技术对样本点模糊隶属度或空间位置关系进行松弛的解决方法只能降低,而无法完全剔除噪声和离群点的影响.为了解决这个问题,提出了基于截断技术的鲁棒模糊C均值(TRFCM)聚类算法.[方法]基于模糊局部信息C均值(FLICM)聚类模型,通过引入截断技术,提出TRFCM算法.该算法的主要思路为:(1)利用FLICM,在学习数据聚类结构的同时保留样本点的局部邻域结构;(2)基于FLICM的聚类结果动态调整原始数据,使其满足期望的聚类结构;(3)将聚类结构特征学习与原始数据的调整(即截断掉部分样本点),统一在一个优化框架中,从而实现组合最优化.将TRFCM算法与近年来相关算法进行比较以检验TRFCM的参数敏感性、收敛性、鲁棒性、时效性等性能.[结果]实验包括5个部分:参数敏感性与收敛性分析、鲁棒性检验、图像分割实验、Benchmark数据集实验和各算法计算时间对比实验.在参数敏感性和收敛性分析中,TRFCM算法在合适的范围内对参数不敏感且在大多数情况下可以获得良好的聚类效果.同时,算法对各数据集的聚类均可以在20轮迭代内收敛.在鲁棒性检验中,TRFCM的准确率是81.55%,较FLICM高出9.71个百分点,聚类结果更接近于真实数据分布,这证明了TRFCM对噪声具有良好的鲁棒性.在图像分割实验中,各对比算法对图像的划分在一定程度上都不够准确,部分算法出现了环境划分不完整、不同的部分错分到相同类中、不同的类之间发生重叠等问题.而TRFCM均规避了这些问题,取得了良好的聚类结果.在添加了均值为0、方差为0.05的高斯噪声的图像分割实验中,TRFCM算法对噪声干扰的抑制效果最优.在Benchmark数据集上,对Banknote Authentication、Wine、COIL20、WarpPIE10P、Yale和USPS数据集进行聚类分析,TRFCM在ACC、NMI与purity三种评价指标上都取得了优于其它对比算法的得分.在算法时效性的实验中,在相近的时间内,相较对比算法TRFCM能够获得更好的聚类效果.[结论]将截断技术引入到模糊聚类算法中,可实现对原始数据的动态调整,剔除噪声和离群点对聚类过程的干扰,从而保留更多对聚类有利的数据细节.基于该思路,利用截断技术以相似的方式对以往其他经典的模糊聚类模型进行改进,可以得到一系列的优化算法,为未来的研究提供新的方向.
高云龙;陈彦光;李辉堆;史曙光;曹超;
厦门大学萨本栋微米纳米科学技术研究院,福建厦门361005厦门大学航空航天学院,福建厦门361102自然资源部第三海洋研究所,福建厦门361005
计算机与自动化
模糊C均值(FCM)鲁棒性截断技术图像分割
《厦门大学学报(自然科学版)》 2024 (002)
P.160-169,178 / 11
国家自然科学基金(42076058);福建省自然科学基金(2022J01061)。
评论