带标记音节的双向维汉神经机器翻译方法OA北大核心CSCDCSTPCD
Bi-directional Uyghur-Chinese Neural Machine Translation with Marked Syllables
近年来,基于神经网络的机器翻译成为机器翻译领域的主流方法,但是在低资源翻译领域中仍存在平行语料不足和数据稀疏的挑战.针对维-汉平行语料不足和维吾尔语形态复杂所导致的数据稀疏问题,从维吾尔语的音节特点出发,将单词切分成音节,同时融入BME(Begin,Middle,End)标记思想,提出一种基于带标记音节的神经网络机器翻译方法.与使用单词粒度和BPE粒度的两类神经网络机器翻译方法对比,该方法在维-汉机器翻译任务中分别提升7.39与3.04个BLEU…查看全部>>
艾山·吾买尔;斯拉吉艾合麦提·如则麦麦提;西热艾力·海热拉;刘文其;吐尔根·依布拉音;汪烈军;瓦依提·阿不力孜
新疆大学 信息科学与工程学院,乌鲁木齐 830046新疆大学 新疆多语种信息技术实验室,乌鲁木齐 830046新疆大学 信息科学与工程学院,乌鲁木齐 830046新疆大学 新疆多语种信息技术实验室,乌鲁木齐 830046新疆大学 信息科学与工程学院,乌鲁木齐 830046新疆大学 新疆多语种信息技术实验室,乌鲁木齐 830046新疆大学 新疆多语种信息技术实验室,乌鲁木齐 830046
信息技术与安全科学
神经机器翻译数据稀疏音节粒度维汉神经机器翻译
《计算机工程与应用》 2021 (4)
基于深度语义的汉维机器翻译研究
161-168,8
国家自然科学基金(61662077)新疆多语种信息技术实验室开放课题(2016D03023)国家语委项目(ZDI135-54).
评论