神经机器翻译的显式句子压缩(CS Comp Lang)

  • 2019 年 12 月 30 日
  • 筆記

原文题目: Explicit Sentence Compression for Neural Machine Translation

摘要:基于变压器的最新技术神经机器翻译(NMT)系统仍遵循标准的编码器-解码器框架,在该框架中,具有自注意机制的编码器可以很好地完成源语句的表示。尽管基于变压器的编码器可以有效地捕获其源句表示形式中的常规信息,但是代表句子要点的主干信息并未特别关注。在本文中,我们提出了一种显式句子压缩方法来增强NMT的源句子表示。在实践中,显式句子压缩目标用于学习句子中的主干信息。我们提出了三种方法,包括主干源侧融合,目标侧融合和两侧融合,将压缩语句集成到NMT中。我们对WMT英语到法语和英语到德语翻译任务的经验测试表明,所提出的句子压缩方法在强大的基准范围内可显著提高翻译性能。

原文作者:Zuchao Li, Rui Wang, Kehai Chen, Masao Utiyama, Eiichiro Sumita, Zhuosheng Zhang, Hai Zhao

原文地址:https://arxiv.org/abs/1912.11980