首页|期刊导航|计算机应用研究|基于主动数据选取的半监督聚类算法

基于主动数据选取的半监督聚类算法OA北大核心CSCDCSTPCD

Novel semi-supervised clustering algorithm based on active data selection

中文摘要英文摘要

利用少量标签数据获得较高聚类精度的半监督聚类技术是近年来数据挖掘和机器学习领域的研究热点.但是现有的半监督聚类算法在处理极少量标签数据和多密度不平衡数据集时的聚类精度比较低.基于主动学习技术研究标签数据选取,提出了一个新的半监督聚类算法.该算法结合最小生成树聚类和主动学习思想,选取包含信息较多的数据点作为标签数据,使用类KNN思想对类标签进行传播.通过在UCI标准数据集和模拟数据集上的测试,结果表明提出的算法比其他算法在处理多密度、不平衡数据集时…查看全部>>

Semi-supervised clustering, which aims to significantly improve the clustering results using limited supervision, has inevitably been the research focus in data mining and machine learning in recent years. But the accuracy of existing semi-clustering algorithms is low when dealing with the datasets with little labeled data or the multi-density and unbalanced datasets. Based on the active learning,this paper studied the data selection and presented a novel se…查看全部>>

文平;冷明伟;陈晓云

兰州大学信息科学与工程学院,兰州730000兰州大学信息科学与工程学院,兰州730000上饶师范学院数学与计算机学院,江西上饶334001

信息技术与安全科学

数据挖掘半监督聚类主动学习标签数据数据选取最小生成树多密度数据集不平衡数据集

data miningsemi-supervised clusteringactive learninglabeled datadata selectionminimum spanning treemulti-density datasetunbalanced dataset

《计算机应用研究》 2012 (8)

2841-2844,4

江西省教育厅科技课题资助项目(GJJ11609)

10.3969/j.issn.1001-3695.2012.08.010

评论

您当前未登录!去登录点击加载更多...