| 注册
首页|期刊导航|计算机应用研究|基于正文结构和长句提取的网页去重算法

基于正文结构和长句提取的网页去重算法

黄仁 冯胜 杨吉云 刘宇 敖民

计算机应用研究2010,Vol.27Issue(7):2489-2491,2497,4.
计算机应用研究2010,Vol.27Issue(7):2489-2491,2497,4.DOI:10.3969/j.issn.1001-3695.2010.07.024

基于正文结构和长句提取的网页去重算法

Detection and elimination of similar Web pages based on text structure and extraction of long sentences

黄仁 1冯胜 1杨吉云 1刘宇 1敖民1

作者信息

  • 1. 重庆大学,计算机学院,重庆,400044
  • 折叠

摘要

关键词

网页去重/正文结构树/长句提取/层次指纹

分类

信息技术与安全科学

引用本文复制引用

黄仁,冯胜,杨吉云,刘宇,敖民..基于正文结构和长句提取的网页去重算法[J].计算机应用研究,2010,27(7):2489-2491,2497,4.

基金项目

重庆市自然科学基金资助项目(CSTC 2007BB3169) (CSTC 2007BB3169)

计算机应用研究

OA北大核心CSCDCSTPCD

1001-3695

访问量0
|
下载量0
段落导航相关论文