一周内容精选 | 热门双语图文(1.11-1.15)

深度学习

一文盘点500+机器学习和深度学习项目》译者:季一帆

机器学习和深度学习有什么有趣好玩的项目? 在实际中计划和执行一个机器学习和深度学习项目将大大地锻炼你的理论实践能力。说不定毕设题目就从这里面出来了。

「新奇」假设!Adam 或许不是最佳的深度学习优化器》译者:Born alone° 

自 2015 年推出以来, Adam 优化器是深度学习中最流行的优化器之一。但近日,波士顿大学助理教授 Francesco Orabona 提出了一种假设,他认为「不是 Adam 最佳,而是神经网络的训练使其变成最佳」。 

机器学习

2021年,图机器学习将去向何方? 译者:Born alone° 

说起2020年AI领域的“当红辣子鸡”,非图机器学习莫属。Michael Bronstein是伦敦帝国理工学院的教授,也是Twitter的图学习研究的负责人。最近, 他回顾了过去一年里图机器学习方面的亮点,并预测了2021的走向。

NeurIPS 2020 最“fancy”的七篇基于模型强化学习论文》译者:FIONAbiubiu

NeurIPS 2020 共收到论文投稿 9454 篇,接收 1900 篇(其中 oral 论文 105 篇、spotlight 论文 280 篇),论文接收率为 20.1%。 作者推荐了7篇基于模型强化学习的论文并作了详细说明。

如何将 Pandas 速度加快100倍?》译者:Born alone° 

Pandas 是探索和处理数据的好工具。因此,它被有意地优化为通用性和易用性,而不是性能。 本文列举了加快 Pandas 速度的6种方法,从矢量化到并行化。 

手把手教你用 Python Pandas,Keras ,Flask ,Docker和 Heroku 部署机器学习模型(附代码) 》译者:话左、Born alone°

在2019年橄榄球世界杯期间,作者做了一个项目来预比赛结果。他将此项目扩展为端到端的机器学习项目,以演示如何将机器学习模型部署为交互式Web应用程序。 

自然语言处理

NLP 详解教程:使用 Spacy 和 Python 实现命名实体识别 (NER) 》译者:FIONAbiubiu

在NLP中,命名实体识别(NER)是信息提取的一个子任务,旨在将文本中的命名实体定位并分类为预先定义的类别,如人员、地点、药物、日期等等。 本文将使用Spacy库进行实践,同事还将展示如何标记数据(这是其他文章所经常忽略的) 。

用 T5 探索迁移学习:文本-文本迁移》译者:江芮、冰糖葫芦红

近年来,迁移学习在自然语言处理( NLP )领域带来了一波新潮流和新研究。2018年到2019年,XLNet、RoBERTa 多种新方法使迁移学习得到了发展。该领域的发展速度使人们难以评估哪些改进最有意义,以及它们何时有效。在“Exploring the Limits of Transfer Learning with a Unified Text-to-Text Transformer”中,我们通过大规模的实证调查来确定哪种迁移学习技术最有效,并在规模上应用这些观点来创建一个新的模型,我们称之为” 文本-文本迁移Transformer” ( Text-to- Text Transfer Transformer,T5 ),我们还引入了一个新的开源预训练数据集,称之为”Colossal Clean Crawled Corpus,C4 ) ”。