基于特征项扩展的中文文本分类方法OA
A Chinese text classification method based on feature expansion
提出了一种基于特征项扩展的中文文本分类方法.该方法首先对文档的特征词进行分析,然后利用HowNet抽取最能代表主题的特征义原,接着根据这些义原对特征项进行扩展,并赋予扩展的特征项适当权值来说明其描述能力.最后利用扩展的特征项集提取特征进行分类.该文重点研究了如何抽取特征义原,如何给扩展项设定一个合适的权值.实验证明,该文方法能增加有效的特征项的数目,使分类正确率和稳定性均得到提高.
陈立伟;井志强;葛秘蕾
哈尔滨工程大学,信息与通信工程学院,黑龙江,哈尔滨,150001哈尔滨工程大学,信息与通信工程学院,黑龙江,哈尔滨,150001哈尔滨工程大学,信息与通信工程学院,黑龙江,哈尔滨,150001
信息技术与安全科学
文本分类特征选择特征项扩展特征义原
《应用科技》 2010 (3)
1-4,29,5
国家自然科学基金资助项目( 607702053).
评论