信息技术与网络安全2022,Vol.41Issue(4):71-76,6.DOI:10.19358/j.issn.2096-5133.2022.04.011
一种基于Simhash算法的重复域名数据去重方法
Method for deleting duplicate domain name data based on Simhash algorithm
侯开茂 1韩庆敏 1吴云峰 1黄兵 1张久发 1柴处处1
作者信息
- 1. 中国电子信息产业集团有限公司第六研究所,北京100083
- 折叠
摘要
关键词
数据去重/域名/Simhash/数据分块分类
信息技术与安全科学引用本文复制引用
侯开茂,韩庆敏,吴云峰,黄兵,张久发,柴处处..一种基于Simhash算法的重复域名数据去重方法[J].信息技术与网络安全,2022,41(4):71-76,6.