面向密度分布不均数据的混合近邻密度峰值聚类算法OA北大核心CSTPCD
密度峰值聚类算法(DPC)的局部密度忽略了密度分布不均数据的疏密差异,易导致类簇中心聚集在密集区域;其分配策略在分配剩余样本时,易将稀疏区域样本错误分配到密集区域,致使聚类效果不佳.为克服上述缺陷,本文提出了面向密度分布不均数据的混合近邻密度峰值聚类(MN-DPC)算法.首先,利用自然近邻信息定义样本的局部密度,平衡稀疏区域与密集区域样本之间的密度差异,从而正确找到稀疏区域的类簇中心;其次,利用样本之间的共享及自然近邻信息对样本相似度进行加权处理,加强了同一类簇样本间的相似度,有效的避免稀疏区域样本被错误分配.本文将MN-DPC算法与IDPC-FA,DPC-DBFN,DPCSA,FNDPC,FKNN-DPC,DPC算法进行对比.实验结果表明,MN-DPC算法能有效聚类密度分布不均及UCI数据集.
吕莉;朱梅子;康平;韩龙哲;
南昌工程学院信息工程学院,江西南昌330099
计算机与自动化
密度峰值聚类局部密度自然近邻共享近邻样本相似性
《控制理论与应用》 2024 (010)
P.1821-1830 / 10
国家自然科学基金项目(62066030,61962036)资助.
评论