首页|期刊导航|计算机应用与软件|基于CNET模型的无词典汉语自动分词算法研究

基于CNET模型的无词典汉语自动分词算法研究OA北大核心

AUTOMATIC CHINESE WORD SEGMENTATION ALGORITHM WITHOUT DICTIONARY BASED ON CNET MODEL

中文摘要

提出了一种新的汉语统计模型CNET,在此基础上提出了一种汉语无词典自动分词算法.该算法首先学习要进行处理的汉语语料,构建CNET,然后根据学习到的知识再去对原始语料进行分词.实验结果表明,该算法分词正确率在70%以上.

刘龙飞;陈斌;党荣

渭南师范学院教务处,陕西,渭南,714000西北大学数学系,陕西,西安,710069渭南师范学院教务处,陕西,渭南,714000

信息技术与安全科学

汉语自动分词互信息CNET

《计算机应用与软件》 2007 (10)

219-221,3

评论

您当前未登录!去登录点击加载更多...