计算机应用研究2018,Vol.35Issue(6):1645-1650,6.DOI:10.3969/j.issn.1001-3695.2018.06.010
基于文本块密度和标签路径覆盖率的网页正文抽取
Webpage content extraction via text block density and tag path coverage
摘要
关键词
正文抽取/文本块密度/标签路径覆盖率/特征融合分类
信息技术与安全科学引用本文复制引用
刘鹏程,胡骏,吴共庆..基于文本块密度和标签路径覆盖率的网页正文抽取[J].计算机应用研究,2018,35(6):1645-1650,6.基金项目
国家重点研发计划资助项目(2016YFB1000901) (2016YFB1000901)
国家自然科学基金资助项目(61273297,61229301,61673152) (61273297,61229301,61673152)
国家教育部创新团队发展计划资助项目(IRT13059) (IRT13059)
国家留学基金资助项目(201506695019) (201506695019)