一周内容精选 | 热门双语图文(11.16-11.20)
1. 《无需依赖英语数据,100种语言互译,脸书推出“ M2M-100”模型》 译者:季一帆
机器翻译(MT)能够打破语言障碍,将不同语种的人团结起来,为不同人群提供有关COVID的权威信息以帮助他们避免感染。Facebook AI首次提出多语言机器翻译(MMT)模型——M2M -100,该模型可以在不依赖英语数据的情况下在任何100种语言间进行翻译,目前项目已开源。
2. 《Twitter图学习研究负责人Michael Bronstein亲述:Twitter从Recsys 2020挑战中学到了什么》译者:听风1996
Twitter与RecSys会议展开合作以支持2020挑战赛。在两周的时间里,发布了一个包含推文和用户参与度组成的数据集,其中有1.6亿条公开推文用于训练,4000万条公开推文用于验证和测试。基于这一挑战的结果,负责人表示仍然不明白在推荐系统中什么构成良好的深度学习架构,他呼吁研究界共同寻找推荐器系统的最佳深度学习架构。
3. 《开源巨献:27个深度强化学习算法的实例项目》 译者:宋怡然
在这篇译文中,您可以找到27个受欢迎的“深度强化学习”方法的实例项目。
4. 《知识图谱改变银行业务模式?基于GraphDB探索FIBO》 译者:季一帆
金融业业务本体(FIBO)是由企业数据管理委员会(EDMC)开发的金融行业概念模型,2017年首发。本文重点关注FIBO本体和词汇表,验证了在FIBO执行推理时,OWL2RL是比RDFS更好的选择。同时,结合推理和属性路径能够检测到一些结构性问题,这些技术的研究为大型、复杂的本体和知识图谱提供质量保证。
5. 《2020年的Deepfake技术开发与应用》 译者:明明知道
通过生成模拟真实人物的图像、视频和声音,Deepfake 能够生动地展现出一个人做了他们从未做过的事、或说了他们从未说过的话。这项技术一旦被滥用,后果将不可设想。2020 年可能会有更多关于监管的讨论,但 deepfake 技术并不会消失,它在未来的应用范围将从良性和新颖到潜在的破坏性和破坏性。
6. 《11款最佳气候变化数据集》 译者:Icarus、
全球变暖的原因到底是人类还是自然趋势?大家可以借助这些数据集去探索下。
7. 《教程:使用BYOL轻松进行自监督学习》 译者:季一帆
BYOL是一种巧妙的自监督学习方法,可以利用未标记的数据来最大限度地提高模型性能。在BYOL之前,多数自我监督学习都可分为对比学习或生成学习,其中,生成学习一般GAN建模完整的数据分布,计算成本较高,相比之下,对比学习方法就很少面临这样的问题。此外,由于所有ResNet模型都是使用ImageNet进行预训练的,因此BYOL的性能优于预训练的ResNet18。
往期推荐: