一种基于分层抽样的大数据快速聚类算法OA北大核心CSTPCD
A LARGE DATA FAST CLUSTERING ALGORITHM BASED ON STRATIFIED SAMPLING
针对K-means算法处理大规模数据时算法迭代时间较长的问题,提出一种基于分层抽样的大数据快速聚类算法(A Large Data Fast Clustering Algorithm Based on Stratified Sampling,FCASS).提出一种分层方法,可以快速将原始数据集进行分层,使得层内数据相似度较大,层间数据相似度较小;引入抽样时间函数,并求得各层样本量的最优分配方案;用K-means算法对样本集进行聚类,得到最终结果.在…查看全部>>
李顺勇;张钰嘉;彭晓庆;曹付元;刘恩乾
山西大学数学科学学院 山西 太原030006山西大学数学科学学院 山西 太原030006山西大学数学科学学院 山西 太原030006山西大学计算机与信息技术学院 山西 太原030006计算智能与中文信息处理教育部重点实验室 山西 太原030006
信息技术与安全科学
K-means分层抽样抽样时间聚类精度运行速度
《计算机应用与软件》 2020 (10)
面向关联关系数据的概念学习方法研究
256-261,277,7
国家自然科学基金项目(61573229)山西省基础研究计划项目(201701D121004)山西省回国留学人员科研资助项目(2017-020)太原市科技计划研发项目(2018140105000084).
评论