首页|期刊导航|电子学报|基于图的Co-Training网页分类

基于图的Co-Training网页分类OA北大核心CSCDCSTPCD

Graph Based Co-Training Algorithm for Web Page Classification

中文摘要英文摘要

本文充分利用网页数据的超链接关系和文本信息,提出了一种用于网页分类的归纳式半监督学习算法:基于图的Co-training网页分类算法(Graph based Co-training algorithm for web page classification),简称GCo-training,并从理论上证明了算法的有效性.GCo-training在Co-training算法框架下,迭代地学习一个基于由超链接信息构造的图的半监督分类器和一个基于文本特征…查看全部>>

This paper proposes a novel inductive semi-supervised algorithm for web page classification named Gco-training, exploiting texts in web pages and hyperlinks among them. Gco-training iteratively trains two classifiers-a graph-based semi-supervised classifier based on hyperlinks among web pages and a Bayes classifier based on texts in web pages, under the framework of Co-training. On the one hand, the graph-based semi-supervised classifier obtains high accurac…查看全部>>

侯翠琴;焦李成

西安电子科技大学智能信息处理研究所和智能感知与图像理解教育部重点实验室,陕西西安,710071西安电子科技大学智能信息处理研究所和智能感知与图像理解教育部重点实验室,陕西西安,710071

信息技术与安全科学

半监督Co-training归纳式网页分类

graph semi-supervised Co-training inductive web page classification

《电子学报》 2009 (10)

Fisher矢量机

2173-2180,2219,9

国家自然科学基金(No.60602064,No.60702062)教育部重点项目(No.108115)国家973重点基础研究发展规划(No.2006CB705707)国家863高技术研究发展计划(No.2007AA12Z223)国家部委科技项目(No.51307040103)教育部长江学者和创新团队支持计划(No.IRT0645)

评论

您当前未登录!去登录点击加载更多...