基于CNET模型的无词典汉语自动分词算法研究OA北大核心
AUTOMATIC CHINESE WORD SEGMENTATION ALGORITHM WITHOUT DICTIONARY BASED ON CNET MODEL
提出了一种新的汉语统计模型CNET,在此基础上提出了一种汉语无词典自动分词算法.该算法首先学习要进行处理的汉语语料,构建CNET,然后根据学习到的知识再去对原始语料进行分词.实验结果表明,该算法分词正确率在70%以上.
刘龙飞;陈斌;党荣
渭南师范学院教务处,陕西,渭南,714000西北大学数学系,陕西,西安,710069渭南师范学院教务处,陕西,渭南,714000
信息技术与安全科学
汉语自动分词互信息CNET
《计算机应用与软件》 2007 (10)
219-221,3
评论