| 注册
首页|期刊导航|计算机应用研究|基于文本块密度和标签路径覆盖率的网页正文抽取

基于文本块密度和标签路径覆盖率的网页正文抽取

刘鹏程 胡骏 吴共庆

计算机应用研究2018,Vol.35Issue(6):1645-1650,6.
计算机应用研究2018,Vol.35Issue(6):1645-1650,6.DOI:10.3969/j.issn.1001-3695.2018.06.010

基于文本块密度和标签路径覆盖率的网页正文抽取

Webpage content extraction via text block density and tag path coverage

刘鹏程 1胡骏 1吴共庆1

作者信息

  • 1. 合肥工业大学计算机与信息学院,合肥230009
  • 折叠

摘要

关键词

正文抽取/文本块密度/标签路径覆盖率/特征融合

分类

信息技术与安全科学

引用本文复制引用

刘鹏程,胡骏,吴共庆..基于文本块密度和标签路径覆盖率的网页正文抽取[J].计算机应用研究,2018,35(6):1645-1650,6.

基金项目

国家重点研发计划资助项目(2016YFB1000901) (2016YFB1000901)

国家自然科学基金资助项目(61273297,61229301,61673152) (61273297,61229301,61673152)

国家教育部创新团队发展计划资助项目(IRT13059) (IRT13059)

国家留学基金资助项目(201506695019) (201506695019)

计算机应用研究

OA北大核心CSCDCSTPCD

1001-3695

访问量0
|
下载量0
段落导航相关论文