|国家科技期刊平台
首页|期刊导航|计算机工程与科学|融合乌尔都语词性序列预测的汉乌神经机器翻译

融合乌尔都语词性序列预测的汉乌神经机器翻译OA北大核心CSTPCD

中文摘要

面向南亚和东南亚的小语种机器翻译,目前已有不少研究团队开展了深入研究,但作为巴基斯坦官方语言的乌尔都语,由于稀缺的数据资源和与汉语之间的巨大差距,有针对性的汉乌机器翻译方法研究非常稀少。针对这种情况,提出了基于Transformer的融合乌尔都语词性序列的汉乌神经机器翻译模型。首先利用Transformer对目标语言乌尔都语的词性序列进行预测,然后将翻译模型的预测结果和词性序列模型的预测结果相结合进行联合预测,从而实现语言知识到翻译模型的融入。在现有小规模汉乌数据集上的实验表明,所提方法在数据集上的BLEU值相较于基准模型提升了0.13,取得了较为明显的效果。

陈欢欢;王剑;Muhammad Naeem Ul Hassan;

昆明理工大学信息工程与自动化学院,云南昆明650500 昆明理工大学云南省人工智能重点实验室,云南昆明650500

计算机与自动化

Transformer神经机器翻译乌尔都语词性序列

《计算机工程与科学》 2024 (003)

P.518-524 / 7

国家自然科学基金(62166022,62266028)。

10.3969/j.issn.1007-130X.2024.03.014

评论