| 注册
首页|期刊导航|微型机与应用|基于网页DOM树节点路径相似度的正文抽取

基于网页DOM树节点路径相似度的正文抽取

潘心宇 陈长福 刘蓉 王美清

微型机与应用2016,Vol.35Issue(19):74-77,4.
微型机与应用2016,Vol.35Issue(19):74-77,4.DOI:10.19358/j.issn.1674-7720.2016.19.022

基于网页DOM树节点路径相似度的正文抽取

Content extraction based on the similarity of the Web pages' DOM tree nodes path

潘心宇 1陈长福 2刘蓉 1王美清1

作者信息

  • 1. 福州大学数学与计算机科学学院,福建福州350108
  • 2. 福建库易信息科技有限责任公司,福建福州350000
  • 折叠

摘要

关键词

DOM树/信息抽取/HTML标签/网页去噪/正文抽取

分类

计算机与自动化

引用本文复制引用

潘心宇,陈长福,刘蓉,王美清..基于网页DOM树节点路径相似度的正文抽取[J].微型机与应用,2016,35(19):74-77,4.

微型机与应用

2097-1788

访问量1
|
下载量0
段落导航相关论文