| 注册
首页|期刊导航|计算机工程与应用|基于机器翻译的维吾尔语形态分析研究

基于机器翻译的维吾尔语形态分析研究

徐春 杨勇 蒋同海

计算机工程与应用2017,Vol.53Issue(14):138-142,154,6.
计算机工程与应用2017,Vol.53Issue(14):138-142,154,6.DOI:10.3778/j.issn.1002-8331.1604-0119

基于机器翻译的维吾尔语形态分析研究

Research on machine translation based Uyghur morphological analysis

徐春 1杨勇 2蒋同海3

作者信息

  • 1. 中国科学院 新疆理化技术研究所,乌鲁木齐 830011
  • 2. 中国科学院大学,北京100049
  • 3. 新疆财经大学 计算机科学与工程学院,乌鲁木齐 830012
  • 折叠

摘要

Abstract

To alleviate the data sparseness and reduce the complexity of models construction in Uyghur morphology anal-ysis, it proposes a Statistical Machine Translation(SMT)based morphology analysis model, which considers the pre-stem words(pre-Part-Of-Speech(POS)tagging)in Uyghur word stemming(POS tagging)as the source part of SMT system, and the post-stemming words (POS tags)as the target part. To optimize the model, it uses dictionaries and joint validation in the model. Experimental results show that, the approach outperforms other systems in Uyghur word stem-ming and part-of-speech tagging. Compared with segmentation and POS tagging tasks in English and Chinese, the approach is more suitable for Uyghur.

关键词

维吾尔语形态分析/基于机器翻译/词干提取/词性标注/模型优化

Key words

Uyghur morphology analysis/machine translation based/word stemming/part-of-speech tagging/model optimization

分类

信息技术与安全科学

引用本文复制引用

徐春,杨勇,蒋同海..基于机器翻译的维吾尔语形态分析研究[J].计算机工程与应用,2017,53(14):138-142,154,6.

基金项目

新疆自治区高校科研计划项目(No.XJEDU2013I27) (No.XJEDU2013I27)

教育部人文社会科学研究项目(No.12XJJC740006) (No.12XJJC740006)

中国科学院西部之光项目(No.XBBS201216,No.LHXZ201301). (No.XBBS201216,No.LHXZ201301)

计算机工程与应用

OA北大核心CSCDCSTPCD

1002-8331

访问量0
|
下载量0
段落导航相关论文