一种基于粗糙熵的改进K-modes聚类算法OA北大核心CSTPCD
K-modes聚类算法被广泛应用于人工智能、数据挖掘等领域。传统的K-modes聚类算法有不错的聚类效果,但是存在迭代次数多、计算量大、容易受到冗余属性的干扰等问题,且仅采用简单的0-1匹配的方法来定义2个样本属性值之间的距离,没有充分考虑每个属性对聚类结果的影响。针对上述问题,该文将粗糙熵引入K-modes算法。首先利用粗糙集属性约简算法消除冗余属性,确定各属性的重要程度;然后利用粗糙熵确定每个属性的权重,从而定义新的类内距离。将该文所提算法与传统的K-modes聚类算法分别在4组公开数据集上进行对比试验。试验结果表明,该文所提算法聚类准确率比传统的K-modes聚类算法更高。
刘财辉;曾雄;谢德华;
赣南师范大学数学与计算机科学学院,江西赣州341000吉安职业技术学院机械与电子工程学院,江西吉安343000
计算机与自动化
聚类K-modes算法粗糙集粗糙熵属性约简权重
《南京理工大学学报》 2024 (003)
P.335-341 / 7
国家自然科学基金(62166001);江西省自然科学基金(20202BAB202010)。
评论