Abstract
尽管神经网络机器翻译模型在拥有大规模高质量平行语料的语言对中取得了很好的性能,但是实验证明。神经网络机器翻译性能在资源匮乏的语言对中大幅下降,甚至不如传统的统计机器翻译模型。本文针对当前的低资源语言神经网络机器翻译所面临的的训练语料稀少的问题,从数据增强和模型融合两方面进行分析。按照训练过程所使用的语料类型,将低资源语言神经网络机器翻译方法划分为监督方法、半监督方法和无监督方法。使用数据增强技术初步尝试了有监督方法的工作,开展了基于枢轴语言的半监督神经网络机器翻译研究,并在最新提出的词嵌入无监督神经网络机器翻译模型的基础上,对翻译模型进行了改进。实验结果表明,有监督和半监督机器翻译方法结果提升较为明显。
Translated title of the contribution | Low-resource Neural Machine Translation Methods |
---|---|
Original language | Chinese (Simplified) |
Pages (from-to) | 29 |
Number of pages | 36 |
Journal | 中国人工智能学会通讯 |
Volume | 3 |
Publication status | Published - 2022 |