| 注册
首页|期刊导航|计算机技术与发展|基于Simhash改进的文本去重算法

基于Simhash改进的文本去重算法

张亚男 陈卫卫 付印金 徐堃

计算机技术与发展2022,Vol.32Issue(8):26-32,7.
计算机技术与发展2022,Vol.32Issue(8):26-32,7.DOI:10.3969/j.issn.1673-629X.2022.08.005

基于Simhash改进的文本去重算法

Improved Text Deduplication Algorithm Based on Simhash

张亚男 1陈卫卫 1付印金 1徐堃1

作者信息

  • 1. 陆军工程大学 指挥控制工程学院,江苏 南京 210007
  • 折叠

摘要

关键词

Simhash/文本去重/词频-逆文本频率/Jaccard相似度/二进制压缩算法/位置特征

分类

信息技术与安全科学

引用本文复制引用

张亚男,陈卫卫,付印金,徐堃..基于Simhash改进的文本去重算法[J].计算机技术与发展,2022,32(8):26-32,7.

基金项目

国家自然科学基金(61402518) (61402518)

江苏省自然科学基金(BK20191327) (BK20191327)

计算机技术与发展

OACSTPCD

1673-629X

访问量0
|
下载量0
段落导航相关论文