计算机工程2015,Vol.41Issue(12):54-57,63,5.DOI:10.3969/j.issn.1000-3428.2015.12.011
基于特征迭代的短文本去重算法
Short Text Duplicate Removal Algorithm Based on Feature Iteration
摘要
关键词
SimHash算法/共享最近邻/迭代/特征选择/短文本/去重Key words
SimHash algorithm/Shared Nearest Neighbor (SNN)/iteration/feature selection/short text/duplicate removal分类
信息技术与安全科学引用本文复制引用
曹海,孙婧,史喜斌..基于特征迭代的短文本去重算法[J].计算机工程,2015,41(12):54-57,63,5.基金项目
国家科技支撑计划基金资助项目(2012BAH13F02) (2012BAH13F02)
上海市科委基金资助项目(12511502403,12511509602). (12511502403,12511509602)