首页|期刊导航|微型电脑应用|基于隐马尔科夫模型的古汉语词性标注

基于隐马尔科夫模型的古汉语词性标注OACSTPCD

Part-of-speech Tagging of Classical Chinese Based on Hidden Markovian Model

中文摘要

古汉语在语法和形态上与现代汉语有着本质的区别.从统计的角度出发,首先为古汉语设计一个标记集,将隐马尔可夫模型(HMM)与维特比算法相结合,以此对古汉语进行词性标注.通过对传统方法的改进,最终bigram模型和trigram模型的标注准确率分别提高到94.9%和96.5%,同时未登录词的标注精度也有显著提高.该方法应用于古汉语词性标注中,能根据古汉语的特点有效提高标注精度,并且在古汉语机器翻译等领域有广泛应用.

杨新生;胡立生

上海交通大学电子信息与电气工程学院,上海200240上海交通大学电子信息与电气工程学院,上海200240

信息技术与安全科学

词性标注古汉语隐马尔科夫模型

《微型电脑应用》 2020 (5)

130-133,4

评论

您当前未登录!去登录点击加载更多...