计算机应用研究2010,Vol.27Issue(7):2489-2491,2497,4.DOI:10.3969/j.issn.1001-3695.2010.07.024
基于正文结构和长句提取的网页去重算法
Detection and elimination of similar Web pages based on text structure and extraction of long sentences
摘要
关键词
网页去重/正文结构树/长句提取/层次指纹分类
信息技术与安全科学引用本文复制引用
黄仁,冯胜,杨吉云,刘宇,敖民..基于正文结构和长句提取的网页去重算法[J].计算机应用研究,2010,27(7):2489-2491,2497,4.基金项目
重庆市自然科学基金资助项目(CSTC 2007BB3169) (CSTC 2007BB3169)