| 注册
首页|期刊导航|计算机应用与软件|结合粗糙集与集成学习的中文文本分类方法研究

结合粗糙集与集成学习的中文文本分类方法研究

张翔 周明全 董丽丽 闫清波

计算机应用与软件2011,Vol.28Issue(1):32-34,3.
计算机应用与软件2011,Vol.28Issue(1):32-34,3.

结合粗糙集与集成学习的中文文本分类方法研究

ON CHINESE TEXT CATEGORIZATION BASED ON ROUGH SET AND ENSEMBLE LEARNING

张翔 1周明全 2董丽丽 3闫清波1

作者信息

  • 1. 西安建筑科技大学信息与控制工程学院,陕西,西安,710055
  • 2. 西北大学信息科学与技术学院,陕西,西安,710127
  • 3. 北京师范大学信息科学与技术学院,北京,100875
  • 折叠

摘要

Abstract

This paper introduces the flow of Chinese text categorisation and the relevant technologies.A text categorisation approach based on the combination of rough set and ensemble learning is proposed on the basis of analyzing the disadvantage of traditional feature selection,the feature selection of the text is executed through the rough set, and an ensemble learning algorithm AdaBoost.M1 is employed to improve the categorising performance of weak classifier to categorise the Chinese text.Experiment indicates that this method has a more excellent classification performance with its Fl value of the categorised outcome higher than that of the C4.5 and the kNN classifiers.

关键词

中文文本分类/粗糙集/集成学习/AdaBoost.M1

引用本文复制引用

张翔,周明全,董丽丽,闫清波..结合粗糙集与集成学习的中文文本分类方法研究[J].计算机应用与软件,2011,28(1):32-34,3.

基金项目

国家自然科学基金项目(60873094). (60873094)

计算机应用与软件

OA北大核心CSCDCSTPCD

1000-386X

访问量0
|
下载量0
段落导航相关论文