一周內容精選 | 熱門雙語圖文(11.30-12.4)

1. 《準備開始學習NLP,我該系統地看哪些書和課程?》譯者:聽風1996、姚晗

作者Elvis Saravia從2013年以來,一直在研究自然語言處理(NLP)。他根據自己的學習經驗列了一份自然語言處理入門資源推薦榜單,並說明了推薦原因。

2. 《我是如何準備機器學習競賽,超詳細的綜合指南》譯者:聽風1996

本文旨在為初學者和專家提供一個模板,讓他們能夠開始學習機器學習競賽(Kaggle、Driven Data、Dphi、Machine Hack等等)。從理論上學習機器學習,理解所有這些令人驚嘆的算法是很意思的,但最重要的部分是實際應用這些概念。實踐活動可以加強你對概念的理解,並會向你展示僅通過理論無法達到的重大發現。 

3. 《孤立森林:大數據背景下的最佳異常檢測算法》譯者:porchy

孤立森林或者”iForest”是一個優美動人,簡潔優雅的算法,只需少量參數就可以檢測出異常點。本篇文章中作者將對iForest 進行總結與闡述。我們可以從文中結果看到,iForest在多種數據集上的ROC表現和精確度都比大多數其他的異常檢測算法要好。 

4. 數據分析 | 最適合學習英語的Netflix電影和電視劇有哪些?譯者:明明知道、Icarus、、求求你了救救孩子

作者用 Python 做了所有這些分析,試圖找到Netflix上最好的英語學習內容。《老友記》詞彙簡單,被認為是學習英語最好的電視節目之一。然而,這部電視劇在Netflix目錄中只排在第78位,這意味着還有77部電視劇和《老友記》一樣好——甚至更好! 

5.  《因果推理「三問」:是什麼?為什麼需要?如何使用?》譯者:聽風1996

因果關係描述的是兩個變量之間的關係,即一個變量如何誘發另一個變量的發生。 它比相關關係要強得多,舉個例子,因果推理可以告訴你,提供促銷活動是否增加了客戶轉化率,以及增加了多少。  在本文中,作者將討論什麼是因果關係,為什麼需要發現因果關係,以及進行因果推理的常用技巧。 

6. 《30個學習示例,從入門到精通PandasFIONAbiubiu、Icarus、

Pandas是一個被廣泛使用的Python數據分析工具,它提供了許多函數和方法,可以加快數據分析和預處理步驟。我將用Kaggle上提供的一個客戶流失數據集上做例子,這些例子涵蓋你在典型的數據分析過程中可能使用的幾乎所有函數和方法。