图书自动分类技术研究与实现OA
提出使用TF-IDF算法与朴素贝叶斯算法相结合,实现图书的自动分类.首先需从互联网中爬取图书信息,主要包括图书基本信息、图书简介、图书目录等;其次,需要对爬取到的图书信息进行预处理,将同类图书的基本信息聚在一起,并进行分词去噪;然后使用TF-IDF算法对每一类图书进行特征提取,获得每一类图书的特征;最后使用朴素贝叶斯算法,并利用训练好的分类特征,计算某本新书的具体分类.实验结果表明,该方法可以简化复杂的图书自动分类过程,提高分类效率,也能保证图书分类的准确性.
刘高军;陈东河
北方工业大学 计算机学院,北京 100144北方工业大学 计算机学院,北京 100144
信息技术与安全科学
图书分类TF-IDF朴素贝叶斯
《软件导刊》 2016 (5)
150-152,3
评论