首页|期刊导航|应用科技|基于特征项扩展的中文文本分类方法

基于特征项扩展的中文文本分类方法OA

A Chinese text classification method based on feature expansion

中文摘要

提出了一种基于特征项扩展的中文文本分类方法.该方法首先对文档的特征词进行分析,然后利用HowNet抽取最能代表主题的特征义原,接着根据这些义原对特征项进行扩展,并赋予扩展的特征项适当权值来说明其描述能力.最后利用扩展的特征项集提取特征进行分类.该文重点研究了如何抽取特征义原,如何给扩展项设定一个合适的权值.实验证明,该文方法能增加有效的特征项的数目,使分类正确率和稳定性均得到提高.

陈立伟;井志强;葛秘蕾

哈尔滨工程大学,信息与通信工程学院,黑龙江,哈尔滨,150001哈尔滨工程大学,信息与通信工程学院,黑龙江,哈尔滨,150001哈尔滨工程大学,信息与通信工程学院,黑龙江,哈尔滨,150001

信息技术与安全科学

文本分类特征选择特征项扩展特征义原

《应用科技》 2010 (3)

1-4,29,5

国家自然科学基金资助项目( 607702053).

10.3969/j.issn.1009-671X.2010.03.001

评论

您当前未登录!去登录点击加载更多...