| 注册
首页|期刊导航|计算机与数字工程|自适应We b页面数据抽取方法❋

自适应We b页面数据抽取方法❋

王龙 陈晓雷 李晓光 宋宝燕

计算机与数字工程2016,Vol.44Issue(11):2204-2208,5.
计算机与数字工程2016,Vol.44Issue(11):2204-2208,5.DOI:10.3969/j.issn.1672-9722.2016.11.022

自适应We b页面数据抽取方法❋

Adaptive Web Data Extraction Method

王龙 1陈晓雷 1李晓光 1宋宝燕1

作者信息

  • 1. 辽宁大学信息学院 沈阳 110036
  • 折叠

摘要

Abstract

According to the web page extraction,an adaptive web data extraction method based on extraction template was proposed.The adaptive web extraction process was given.The extraction rules and the adaptive search rules were de-fined,the matching method of the web page and the extraction template was presented,and the process of target data search and extraction template adaptive repair was described in details.Experimental results showed that the recall rate and preci-sion rate were more than 95%,and the method can effectively reduce the quantity of extraction templates.

关键词

自适应/数据抽取/Web数据/抽取模板/匹配度

Key words

adaptive/data extraction/Web data/extarction template/matching degree

分类

信息技术与安全科学

引用本文复制引用

王龙,陈晓雷,李晓光,宋宝燕..自适应We b页面数据抽取方法❋[J].计算机与数字工程,2016,44(11):2204-2208,5.

基金项目

国家自然科学基金(编号:61472169) (编号:61472169)

辽宁省科学技术基金(编号:20141049) (编号:20141049)

辽宁大学博士启动基金资助。 ()

计算机与数字工程

OACSTPCD

1672-9722

访问量1
|
下载量0
段落导航相关论文