融合底层信息的电气工程领域神经机器翻译OACSTPCD
针对目前主流的神经机器翻译模型Transformer内部结构单元堆叠而造成的底层信息丢失和多层单元输出信息偏差不同的问题,对其结构进行了改进,提出了一种融合底层信息的神经机器翻译模型。采用多种网络结构对源语言进行底层信息的特征提取,并采用残差连接的方式实现底层信息的向上传递。实验结果显示:融合底层信息后的翻译模型在电气工程领域内的双语评估研究(BLEU)值最多提升了2.47个百分点。
陈媛;陈红
河南科技大学外国语学院,河南洛阳471023河南科技大学信息工程学院,河南洛阳471023 河南科技大学河南省电力电子装置与系统工程研究中心,河南洛阳471023
计算机与自动化
神经机器翻译电气工程底层信息Multi-Head Self-Attention
《河南科技大学学报:自然科学版》 2023 (6)
P.42-48,M0004,M0005,9
评论