一周内容精选 | 热门双语图文(11.30-12.4)
1. 《准备开始学习NLP,我该系统地看哪些书和课程?》译者:听风1996、姚晗
作者Elvis Saravia从2013年以来,一直在研究自然语言处理(NLP)。他根据自己的学习经验列了一份自然语言处理入门资源推荐榜单,并说明了推荐原因。
2. 《我是如何准备机器学习竞赛,超详细的综合指南》译者:听风1996
本文旨在为初学者和专家提供一个模板,让他们能够开始学习机器学习竞赛(Kaggle、Driven Data、Dphi、Machine Hack等等)。从理论上学习机器学习,理解所有这些令人惊叹的算法是很意思的,但最重要的部分是实际应用这些概念。实践活动可以加强你对概念的理解,并会向你展示仅通过理论无法达到的重大发现。
3. 《孤立森林:大数据背景下的最佳异常检测算法》译者:porchy
孤立森林或者”iForest”是一个优美动人,简洁优雅的算法,只需少量参数就可以检测出异常点。本篇文章中作者将对iForest 进行总结与阐述。我们可以从文中结果看到,iForest在多种数据集上的ROC表现和精确度都比大多数其他的异常检测算法要好。
4. 《数据分析 | 最适合学习英语的Netflix电影和电视剧有哪些?》译者:明明知道、Icarus、、求求你了救救孩子
作者用 Python 做了所有这些分析,试图找到Netflix上最好的英语学习内容。《老友记》词汇简单,被认为是学习英语最好的电视节目之一。然而,这部电视剧在Netflix目录中只排在第78位,这意味着还有77部电视剧和《老友记》一样好——甚至更好!
5. 《因果推理“三问”:是什么?为什么需要?如何使用?》译者:听风1996
因果关系描述的是两个变量之间的关系,即一个变量如何诱发另一个变量的发生。 它比相关关系要强得多,举个例子,因果推理可以告诉你,提供促销活动是否增加了客户转化率,以及增加了多少。 在本文中,作者将讨论什么是因果关系,为什么需要发现因果关系,以及进行因果推理的常用技巧。
6. 《30个学习示例,从入门到精通Pandas》FIONAbiubiu、Icarus、
Pandas是一个被广泛使用的Python数据分析工具,它提供了许多函数和方法,可以加快数据分析和预处理步骤。我将用Kaggle上提供的一个客户流失数据集上做例子,这些例子涵盖你在典型的数据分析过程中可能使用的几乎所有函数和方法。