计算机应用研究2010,Vol.27Issue(3):874-878,5.DOI:10.3969/j.issn.1001-3695.2010.03.018
基于内码序值聚类的相似重复记录检测方法
Approach for detecting approximately duplicate records based on cluster of inner code's sequence value
摘要
关键词
相似重复记录/内码序值/聚类/等级法Key words
approximately duplicate records/inner code's sequence value/cluster/rank method分类
信息技术与安全科学引用本文复制引用
鲁均云,李星毅,施化吉,马素琴..基于内码序值聚类的相似重复记录检测方法[J].计算机应用研究,2010,27(3):874-878,5.基金项目
国家火炬计划资助项目(2004EB33006[0]) (2004EB33006[0])
江苏省高校自然科学指导性计划资助项目(05JKD520050) (05JKD520050)