神經機器翻譯的顯式句子壓縮(CS Comp Lang)

  • 2019 年 12 月 30 日
  • 筆記

原文題目: Explicit Sentence Compression for Neural Machine Translation

摘要:基於變壓器的最新技術神經機器翻譯(NMT)系統仍遵循標準的編碼器-解碼器框架,在該框架中,具有自注意機制的編碼器可以很好地完成源語句的表示。儘管基於變壓器的編碼器可以有效地捕獲其源句表示形式中的常規信息,但是代表句子要點的主幹信息並未特別關注。在本文中,我們提出了一種顯式句子壓縮方法來增強NMT的源句子表示。在實踐中,顯式句子壓縮目標用於學習句子中的主幹信息。我們提出了三種方法,包括主幹源側融合,目標側融合和兩側融合,將壓縮語句集成到NMT中。我們對WMT英語到法語和英語到德語翻譯任務的經驗測試表明,所提出的句子壓縮方法在強大的基準範圍內可顯著提高翻譯性能。

原文作者:Zuchao Li, Rui Wang, Kehai Chen, Masao Utiyama, Eiichiro Sumita, Zhuosheng Zhang, Hai Zhao

原文地址:https://arxiv.org/abs/1912.11980