首页|期刊导航|计算机应用与软件|一种基于分层抽样的大数据快速聚类算法

一种基于分层抽样的大数据快速聚类算法OA北大核心CSTPCD

A LARGE DATA FAST CLUSTERING ALGORITHM BASED ON STRATIFIED SAMPLING

中文摘要

针对K-means算法处理大规模数据时算法迭代时间较长的问题,提出一种基于分层抽样的大数据快速聚类算法(A Large Data Fast Clustering Algorithm Based on Stratified Sampling,FCASS).提出一种分层方法,可以快速将原始数据集进行分层,使得层内数据相似度较大,层间数据相似度较小;引入抽样时间函数,并求得各层样本量的最优分配方案;用K-means算法对样本集进行聚类,得到最终结果.在…查看全部>>

李顺勇;张钰嘉;彭晓庆;曹付元;刘恩乾

山西大学数学科学学院 山西 太原030006山西大学数学科学学院 山西 太原030006山西大学数学科学学院 山西 太原030006山西大学计算机与信息技术学院 山西 太原030006计算智能与中文信息处理教育部重点实验室 山西 太原030006

信息技术与安全科学

K-means分层抽样抽样时间聚类精度运行速度

《计算机应用与软件》 2020 (10)

面向关联关系数据的概念学习方法研究

256-261,277,7

国家自然科学基金项目(61573229)山西省基础研究计划项目(201701D121004)山西省回国留学人员科研资助项目(2017-020)太原市科技计划研发项目(2018140105000084).

10.3969/j.issn.1000-386x.2020.10.041

评论

您当前未登录!去登录点击加载更多...