創立僅一年多,ML資源網站Papers with Code宣布加入Facebook AI

  • 2019 年 12 月 24 日
  • 筆記

機器之心報道

機器之心編輯部

近日,機器學習資源網站 Papers with Code 宣布正式併入 Facebook AI。Papers with Code 創立僅一年多,憑藉著豐富的開放資源和卓越的社區服務,已成為機器學習研究者中最常用的資源網站之一。

Papers with Code 正式加入 Facebook,這足以說明隨著機器學習領域論文數量的劇增,如何快速獲取想要的論文極其重要。機器之心之前也從 state-of-the-art 出發,嘗試採集各領域的頂級論文,並希望有助於讀者獲取最新的研究成果。

關於機器之心「SOTA 模型」項目,讀者可閱讀:

不論是 Papers with Code 還是機器之心的「SOTA 模型」,甚至開源的 ArXiv Sanity、ArXiv Vanity,這些工具都旨在提升獲取研究成果的效率與體驗。可以想像,隨著機器學習社區的擴展,我們會應用更多的 NLP 前沿成果構建更強大的應用,這是一個美妙的循環。

Papers with Code 加入 Facebook AI

14 日,Papers with Code 的兩位聯合創始人 Robert Stojnic 和 Ross Taylor 在 Medium 上發布公開信,宣布 Papers with Code 正式加入 Facebook AI。

聯合創始人 Robert Stojnic 和 Ross Taylor 公開信。

在信中,兩位聯合創始人表示:

今天,我們很高興地宣布,Papers with Code 將正式加入 Facebook AI,以加速我們的增長。Facebook 一直以來是再現性和開放訪問的擁護者,並且在程式碼和模型研究及發布方面處於領先地位。我們在發展戰略上具有高度的一致性,希望明年雙方可以共同前進。

隨後,Facebook 官方推特的回復也證實了這一事件。

@Facebook AI:「我們也很高興,歡迎團隊的加入!」

Papers with Code 是什麼?

Papers with Code 建立於 2018 年 7 月,初衷是希望能夠幫助機器學習的愛好者跟蹤最新發布的論文及源程式碼,快速了解最前沿的技術進展。網站廣泛涉及了各類機器學習任務,包括電腦視覺、自然語言處理、醫療、方法(Methodology)、語音、遊戲、圖、時序、音頻、機器人、音樂、推理、電腦程式碼、知識庫、對抗等方面的內容。

網站將 arXiv 上最新的機器學習論文與 GitHub 上的程式碼(TensorFlow/PyTorch/MXNet 等)對應起來,讓用戶可以按標題關鍵詞查詢,或者按流行程度、GitHub 收藏數排列「熱門研究」。對於所有來到 Papers With Code 網站上的機器學習愛好者,網站所有內容都是可編輯和版本化的。用戶可以從中發現好的任務和最優結果,或者學習一些以前未發現的研究精華。

至今為止,Papers with Code 累積了 18000 篇論文、1000 項任務和 1500 個排行榜,已成長為最常用的機器學習資源網站之一。

根據公開信內容,Papers with Code 併入 Facebook AI 後,將繼續保持平台獨立性,相關服務、社區和網站的運行及互動方式都不會改變,「雙方會在保持戰略高度一致的基礎上共同前進」。

來自倫敦的初創企業 Atlas ML

Papers with Code 網站背後的公司名為 Atlas ML,與網站同期創辦,創始人為 Robert Stojnic 和 Ross Taylor,公司地址位於英國倫敦。

除了資源網站,Atlas ML 也正在延伸其業務範圍,包括評估服務(evaluation service)sotabench,以及藉助前沿 NLP 技術提取和檢索深度學習新方法與新結果。

創建者之一 Robert Stojnic 在 2012 年於劍橋大學取得計算生物學博士學位。2018 年 7 月創辦 Atlas ML 及網站 Papers with Code,目前擔任 Atlas ML 的 CEO 職位。

Ross Taylor 在 2014 年於劍橋大學取得經濟學碩士學位,畢業後曾在金融行業從事軟體開發和機器學習模型設計等工作,2018 年聯合創辦 Atlas ML,目前擔任 CTO 一職。

機器之心「SOTA 模型」項目

與 Papers with Code 特別關注開源程式碼不同,機器之心的「SOTA 模型」會關注演算法本身的效果。因為模型演算法在不同數據集、度量方法下表現都不同,因此將它們歸入對應的任務、數據集、度量方法,我們可以清晰地了解各個模型的優勢與特點。

機器之心也曾測試過 SOTA 模型,看看我們到底能基於它獲得什麼樣的資訊。我們從機器翻譯與生成對抗網路出發,分析了當前頂級模型的主要思路與發展路徑。比如說機器翻譯,我們確實能體會到在 Transformer 之後,機器翻譯頂級模型主要在半監督、預訓練語言模型、訓練機制等幾個方向做出了進一步的探索,它們的效果都能達到當前 SOTA。

根據 SOTA 模型獲得的更多洞見可查閱文章:

Papers with Code 確實非常方便,尤其是那些非常受關注的熱門研究。但我們認為,依靠自動爬取或用戶提交是遠遠不夠的,很多重要研究還是有可能忽略掉。因此機器之心希望結合目前已有的知識庫、新聞庫等模組,結合編輯們的日常論文處理結果,為 SOTA 提供更加新鮮與高效的資訊。

最後,與 Papers with Code 一樣,機器之心的「SOTA 模型」也在不停地改進中。Papers with Code 能獲得 Facebook AI 的幫助,我們也希望能獲得讀者們的使用回饋,這樣才能繼續為讀者提供體驗更佳的機器學習資源。

參考鏈接:

https://medium.com/paperswithcode/papers-with-code-is-joining-facebook-ai-90b51055f694

https://atlasml.io (https://atlasml.io/)