基于隐马尔科夫模型的古汉语词性标注OACSTPCD
Part-of-speech Tagging of Classical Chinese Based on Hidden Markovian Model
古汉语在语法和形态上与现代汉语有着本质的区别.从统计的角度出发,首先为古汉语设计一个标记集,将隐马尔可夫模型(HMM)与维特比算法相结合,以此对古汉语进行词性标注.通过对传统方法的改进,最终bigram模型和trigram模型的标注准确率分别提高到94.9%和96.5%,同时未登录词的标注精度也有显著提高.该方法应用于古汉语词性标注中,能根据古汉语的特点有效提高标注精度,并且在古汉语机器翻译等领域有广泛应用.
杨新生;胡立生
上海交通大学电子信息与电气工程学院,上海200240上海交通大学电子信息与电气工程学院,上海200240
信息技术与安全科学
词性标注古汉语隐马尔科夫模型
《微型电脑应用》 2020 (5)
130-133,4
评论