動態 | FAIR 最新論文:一種不需要訓練就能探索句子分類的隨機編碼器
- 2019 年 11 月 1 日
- 筆記
這篇論文被發布在 arxiv 上,主要講了一種不需要訓練就能探索句子分類的隨機編碼器。論文的主要介紹如下:
研究內容:
這是一個強大的,新穎的語句嵌入基準線,它不需要進行任何訓練。在沒有任何額外訓練的情況下,我們探索了用預訓練單詞嵌入來計算句子表達方式的各種方法。其目的是讓語句嵌入具有更堅實的基礎:1)看看現代句子嵌入從訓練中獲得了多少好處(令人驚訝的是,事實證明,這是微乎其微的);2)為該領域提供更合適(也更強大)的基準線。
它是如何工作的:
句子嵌入是一種矢量表示方法,其中句子被映射到表示其意義的數字序列。這通常是通過組合函數轉換單詞嵌入來創建的。句子嵌入是自然語言處理(NLP)中的一個熱門話題,因為它比單獨使用單詞嵌入更容易進行文本分類。鑒於句子表達研究的快速進展,建立堅實的基準線是很重要的。
我們開始使用當前最先進的方法來確定有哪些收穫,而不是採用隨機的方法,這些隨機的方法只結合了預訓練的單詞嵌入。隨機特性的作用在機器學習社區中早已為人所知,因此我們將其應用到這個 NLP 任務中。我們探索了三種方法:隨機嵌入投影包、隨機 LSTM 和回聲狀態網路。我們的研究結果表明,句子嵌入中的提升很大程度上來自於詞語表徵。我們發現,對經過預訓練的單詞嵌入的隨機參數化構成了一個非常強的基準線,有些時候,這些基準線甚至與諸如 SkipThought 和 InferSent 等著名的句子編碼器的性能相匹配。這些發現為今後的句子表徵學習的研究提供了強有力的基礎。我們還對句子分類評估的一些合適的實驗方案進行了認真的探討,並對今後的研究提出了建議。
為什麼它如此重要:
儘管最近對句子編碼的研究較多,但是 NLP 的研究者們對於辭彙嵌入和句子嵌入之間的關係仍然知之甚少。隨著該領域研究的快速進展,對不同方法進行比較並不總是正確的。每隔一段時間我們需要往前回顧,以便對現有的最先進的方法產生更深入地理解,並分析這些方法為什麼有效,這一點很重要。通過對句子嵌入的研究提供新的見解,並設置更強的基準線,我們可以提高對神經網路表示和理解語言的原理的認識。他們在 Github 上分享了他們的程式碼 https://github.com/facebookresearch/randsent 。
論文原文見:
No Training Required: Exploring Random Encoders for Sentence Classification
https://arxiv.org/abs/1901.10444
via:https://code.fb.com/ml-applications/random-encoders/