| 注册
首页|期刊导航|计算机工程|基于特征迭代的短文本去重算法

基于特征迭代的短文本去重算法

曹海 孙婧 史喜斌

计算机工程2015,Vol.41Issue(12):54-57,63,5.
计算机工程2015,Vol.41Issue(12):54-57,63,5.DOI:10.3969/j.issn.1000-3428.2015.12.011

基于特征迭代的短文本去重算法

Short Text Duplicate Removal Algorithm Based on Feature Iteration

曹海 1孙婧 1史喜斌1

作者信息

  • 1. 复旦大学计算机科学技术学院上海市数据科学重点实验室,上海201203
  • 折叠

摘要

关键词

SimHash算法/共享最近邻/迭代/特征选择/短文本/去重

Key words

SimHash algorithm/Shared Nearest Neighbor (SNN)/iteration/feature selection/short text/duplicate removal

分类

信息技术与安全科学

引用本文复制引用

曹海,孙婧,史喜斌..基于特征迭代的短文本去重算法[J].计算机工程,2015,41(12):54-57,63,5.

基金项目

国家科技支撑计划基金资助项目(2012BAH13F02) (2012BAH13F02)

上海市科委基金资助项目(12511502403,12511509602). (12511502403,12511509602)

计算机工程

OA北大核心CSCDCSTPCD

1000-3428

访问量0
|
下载量0
段落导航相关论文