首页|期刊导航|微型电脑应用|基于隐马尔科夫模型的古汉语词性标注

基于隐马尔科夫模型的古汉语词性标注OACSTPCD

Part-of-speech Tagging of Classical Chinese Based on Hidden Markovian Model

中文摘要

古汉语在语法和形态上与现代汉语有着本质的区别.从统计的角度出发,首先为古汉语设计一个标记集,将隐马尔可夫模型(HMM)与维特比算法相结合,以此对古汉语进行词性标注.通过对传统方法的改进,最终bigram模型和trigram模型的标注准确率分别提高到94.9％和96.5％,同时未登录词的标注精度也有显著提高.该方法应用于古汉语词性标注中,能根据古汉语的特点有效提高标注精度,并且在古汉语机器翻译等领域有广泛应用.

作者：杨新生;胡立生

作者单位：上海交通大学电子信息与电气工程学院,上海200240上海交通大学电子信息与电气工程学院,上海200240

分类：信息技术与安全科学

中文关键词：词性标注古汉语隐马尔科夫模型

刊名：《微型电脑应用》 2020 (5)

页码/页数：130-133,4

您当前未登录！

去登录

点击加载更多...

基于隐马尔科夫模型的古汉语词性标注OACSTPCD

Part-of-speech Tagging of Classical Chinese Based on Hidden Markovian Model

评论