首页|期刊导航|计算机工程与科学|基于枢轴语言的汉越神经机器翻译伪平行语料生成

基于枢轴语言的汉越神经机器翻译伪平行语料生成OA北大核心CSCDCSTPCD

Pseudo-parallel corpus generation for Chinese-Vietnamese neural machine translation based on pivot language

中文摘要

低资源型的汉越神经机器翻译中,数据稀疏问题是影响翻译性能的主要原因,目前缓解该问题的途径之一是通过语料扩充方法生成伪平行数据,并用于机器翻译模型的训练,伪平行数据生成方法主要有基于词的替换、单语数据回译和枢轴翻译3种.目前的研究集中于3种方法的单独使用,缺少方法间融合利用方面的研究工作,针对此问题,提出了融入双语词典的正反向枢轴方法,利用英语作为枢轴语言,在汉到英到越正向枢轴的基础上,融入利用稀有词构建的汉-英和英-越双语词典,将汉语单语数据通过…查看全部>>

贾承勋;赖华;余正涛;文永华;于志强

昆明理工大学信息工程与自动化学院,云南昆明650500昆明理工大学云南省人工智能重点实验室,云南昆明650500昆明理工大学信息工程与自动化学院,云南昆明650500昆明理工大学云南省人工智能重点实验室,云南昆明650500昆明理工大学信息工程与自动化学院,云南昆明650500

信息技术与安全科学

汉-越神经机器翻译伪平行数据生成词替换回译枢轴

《计算机工程与科学》 2021 (3)

基于枢轴语言的汉越句法统计翻译方法研究

542-550,9

国家重点研发计划(2019QY1801)国家自然科学基金(61672271,61732005,61761026,61762056,61866020)云南省高新技术产业专项(201606)

10.3969/j.issn.1007-130X.2021.03.021

评论

您当前未登录!去登录点击加载更多...