2019年Reddit機器學習17個高贊項目:AI德撲大師、StyleGAN等上榜

  • 2019 年 12 月 23 日
  • 筆記


新智元報道

來源:Medium

編輯:大明

【新智元導讀】本文是Medium網友整理的2019年Reddit機器學習板塊熱門高贊項目資源匯總,既有Facebook、NVIDIA 等大廠的作品,也有網友自製的有趣小嘗試,共17個項目,按熱度高低排序,一起看看吧!戳右邊鏈接上 新智元小程式 了解更多!

本貼總結了2019年Reddit機器學習板塊中分享的17個令人印象深刻的項目、研究、demo以及更多相關內容。其中既包括AI大廠的高光項目(GPT-2、StyleGAN等),也有小團隊甚至個人做出的有趣的東西。希望小夥伴們能在這些精選資源中獲得自己的收穫。

1,少量無監督的影像到影像翻譯(913⬆️)

「本項目的靈感來自人類自身。人可以從少量示例中獲取新對象的本質,並進行概括。本項目實現了一種無監督模式的影像到影像轉換演算法,在測試時僅由幾個示例影像加以確定,就能用於之前未見過的新目標類。

資源地址:https://github.com/NVlabs/FUNIT

2,二次元小姐姐生成器(521⬆️)

作者提出了一種能夠繪製漫畫的人工神經網路。Waifu可選擇喜歡的角色,並在此基礎上生成喜歡的動漫。

資源地址:https://waifulabs.com/

3,最大的機器學習數據集列表(499⬆️)

本列表收錄了一系列可以用於機器學習實驗的機器學習數據集。這種資源肯定可以減少在線查找數據集所需的時間。數據集按任務類別/領域進行細分,包括:電腦視覺,自然語言處理,自動駕駛,品質檢查,音頻、醫療應用,還可以選擇按許可類型排序。

資源地址:https://www.datasetlist.com/

4,數據集:480000條「爛番茄」影評資源庫,已標記為新鮮/爛(464⬆️)

作者在互聯網上收集大量的「爛番茄」網站的影評,這些數據在NLP任務中可能非常有用。

資源地址:

https://github.com/nicolas-gervais/6-607-Algorithms-for-Big-Data-Analysis/blob/master/scraping%20all%20critic%20reviews%20from%20rotten%20tomatoes

數據集可在Google雲盤上下載

https://drive.google.com/file/d/1N8WCMci_jpDHwCVgSED-B9yts-q9_Bb5/view

5,使用ML創建「貓門」,當貓嘴裡有獵物時會自動鎖門(464⬆️)

這篇文章是關於使用機器學習創建的貓門。影片中的講者創建了一個「貓門」,如果貓的嘴裡有東西,就會自動鎖門15分鐘。這能防止貓咪將死動物帶入房屋。作者將攝影機連接到貓的門上,然後應用機器學習來檢查貓的嘴裡是否有東西。

影片:https://youtu.be/1A-Nf3QIJjM

6,基於神經點的圖形(415⬆️)

作者提出了一種基於點的新方法來對複雜場景進行建模。使用原始點雲作為場景的幾何表示。然後用可學習的神經描述符擴充每個點。神經描述符對局部幾何形狀和外觀進行編碼。通過將點雲進行柵格化,從新視點傳遞到深度渲染網路中,獲得新的場景視圖。

論文:https://arxiv.org/abs/1906.08240

7,AdaBound:一種基於PyTorch實現的優化器,訓練速度堪比Adam,品質堪比SGD(ICLR 2019)

AdaBound是一種優化程式,旨在提高不可見的數據的訓練速度和性能,可用PyTorch實現。

資源地址:https://github.com/Luolc/AdaBound

8,Facebook與卡內基梅隆大學聯合打造德州撲克AI,在6人比賽中擊敗職業玩家(390⬆️)

「Pluribus是第一款能夠在六人無限注德州撲克擊敗人類專家的AI,這是AI第一次在超過兩個玩家的複雜遊戲中擊敗頂級人類玩家。

Facebook部落格:https://ai.facebook.com/blog/pluribus-first-ai-to-beat-pros-in-6-player-poker/

9,各種ML模型的NumPy實現(388⬆️)

作者在項目頁面上:「 numpy-ml是越來越多的專門用NumPy和Python標準庫編寫的機器學習模型、演算法和工具的集合。」

資源:https://github.com/ddbourgin/numpy-ml

10、17種深度強化學習演算法的PyTorch實現(388⬆️)

作者列出了17種深度強化學習演算法的PyTorch實現。包括DQN,DQN-HER,DoubleDQN,REINFORCE,DDPG,DDPG-HER,PPO,SAC,離散SAC,A3C,A2C等。

資源:

https://github.com/p-christ/Deep-Reinforcement-Learning-Algorithms-with-PyTorch

11、100萬張AI生成的假臉(373⬆️)

用NVIDIA的StyleGAN生成的100萬張假臉。這些臉看起來與真人完全一樣。

資源:https://archive.org/details/1mFakeFaces

12,教神經網路開車(358⬆️)

「本項目教神經網路如何駕駛汽車。這個網路很簡單,具有固定數量的隱藏節點(沒有NEAT),沒有偏差。然而,經過短短几代的學習,它成功學會了快速安全地駕駛汽車。「該網路通過隨機突變後成功學會了開賽車。」

影片:https://youtu.be/wL7tSgUpy8w

13,一個簡單庫,將機器學習模型轉換為本地程式碼(Python / C / Java)(345⬆️)

m2cgen(模型2程式碼生成器)是一個輕量級庫,可以提供簡便方法,將經過訓練的統計模型轉換為本地程式碼。(支援Python,C,Java,Go,JavaScript,VisualBasic,C#)。」

地址:https://github.com/BayesWitnesses/m2cgen/

當前支援的模型如下:

14,探索神經網路的損失情況(339⬆️)

摘自作者的帖子:「該帖子是為了在神經網路的損失平面中找到不同的模式。通常,損失最小值處就像是一個坑,其周圍是隨機分布的丘陵和山脈,但也存在更有意義的坑,如下圖所示。

資源:https://github.com/universome/loss-patterns

論文:https://arxiv.org/abs/1910.03867

「結果表明,我們幾乎可以找到自己喜歡的任何損失的最小值。有趣的是,結果的橫向模式對於測試集也仍然有效,也就是說,這是一種很可能在整個數據分布上都有效的屬性。」

15,OpenAI基於GPT-2的Reddit 機器人(343⬆️)

本項目構建了一個由OpenAI的GPT-2驅動的Reddit機器人。相關程式碼可以在下面的資源中找到。

資源:https://github.com/shevisjohnson/gpt-2_bot

16,Super SloMo:一個卷積神經網路,可將任何影片轉換為slomo影片(332⬆️)

論文:https://people.cs.umass.edu/~hzjiang/projects/superslomo/

程式碼:https://github.com/avinashpaliwal/Super-SloMo

17,NLP的預訓練模型庫:Bert,GPT,GPT-2,Transformer-XL,XLNet,XLM(306⬆️)

這是用於NLP的預訓練Transformer模型的開源庫。它具有六種架構,分別是:

  • Google的BERT
  • OpenAI的GPT和GPT-2
  • Google / CMU的Transformer-XL和XLNet
  • Facebook的XLM

該庫為這些架構提供了27種預訓練的模型權重。

資源:https://github.com/huggingface/transformers

原文鏈接:

https://heartbeat.fritz.ai/best-of-machine-learning-in-2019-reddit-edition-5fbb676a808