计算机与数字工程2016,Vol.44Issue(5):895-900,943,7.DOI:10.3969/j.issn.1672-9722.2016.05.026
一种高效的分布式相似短文本聚类算法
An Efficient Distributed Similar Short Texts Clustering Algorithm
摘要
关键词
文本聚类/最小哈希/局部敏感哈希/shingling/SparkKey words
text clustering/minHashing/LSH/shingling/Spark分类
信息技术与安全科学引用本文复制引用
原默晗,唐晋韬,王挺..一种高效的分布式相似短文本聚类算法[J].计算机与数字工程,2016,44(5):895-900,943,7.基金项目
国家自然科学基金项目(编号:61200337)资助. (编号:61200337)