征集 | 用于发布研究论文代码的国内优质资源(软件、平台、服务)

  • 2020 年 12 月 18 日
  • AI

为了促进机器学习项目的可重复性,我们需要能够提高交流科研成果的效率工具(不限于软件、网站或平台)
本次征集工作的意义详见:发布研究论文代码的小技巧
征集工作结果将作为开源项目发布于 datawhalechina/releasing-research-code

现在需要做的是,补全该文档的【国内部分】。

恳求各位的帮助,提高国内的科研工作交流效率。

国外工具参考

网盘

用途:托管预训练模型文件

  1. Zenodo – 支持版本管理,50GB,带宽免费,DOI,可长期保存
  2. GitHub Releases – 支持版本管理,2GB 文件大小限制,带宽免费
  3. OneDrive – 支持版本管理,2GB(免费 )/ 1TB (需要Office 365套装),带宽免费
  4. Google Drive – 支持版本管理,15GB,带宽免费
  5. Dropbox – 支持版本管理,2GB(付费无限容量),带宽免费
  6. AWS S3 – 支持版本管理,仅付费使用,带宽需付费

管理模型文档

  1. RClone – 针对众多不同的云存储提供商,提供统一访问方案

标准化模型接口

  1. PyTorch Hub
  2. Tensorflow Hub
  3. Hugging Face NLP models
  4. ONNX

指标排行榜

  1. Papers with Code leaderboards – with 2500+ leaderboards
  2. CodaLab – with 450+ leaderboards
  3. NLP Progress – with 90+ leaderboards
  4. EvalAI – with 50+ leaderboards
  5. Collective Knowledge – with 40+ leaderboards
  6. Weights & Biases – Benchmarks – with 9+ leaderboards

网页制作

用途:制作项目页面

  1. GitHub pages
  2. Fastpages

代码在线交互+算力平台

用途:制作示例和指南

  1. Google Colab
  2. Binder
  3. Streamlit


参与方式(如下任何方便的方式)

欢迎以任何方式参与到研究项目开源工具征集中,为促进科研成果交流而努力。

征集 | 用于发布研究论文代码国内优质资源(软件、平台、服务)

  1. 直接评论本篇文章

2. 直接编辑在线表格:腾讯文档

3. 直接编辑在线文档:无标题文档

4. 直接填写调查问卷:问卷系统

注:以评论和问卷形式优先,方便记录贡献者的信息。

恳请人工智能领域、科研领域和开源领域的师长和朋友们提供建议!


致谢(本开源项目完成后,会逐一记录所有提供了建设性意见的朋友)

  1. 特别感谢 @P小二

托管预训练模型文件

托管大文件,基本都是各种网盘,百度网盘,360网盘,不付费速度比较慢。
码云附件最大100MB,根本不够存。
还有各大云服务器商的存储分发服务,这个收费比较贵。

托管预训练模型文件

国内没有这种服务,只是一个多个存储服务的同步服务,这个可以可以写。

标准化模型接口

PaddleHub
MegEngine Model Hub

指标排行榜

中文语言理解基准测评(CLUE) cluebenchmarks.com/inde

制作项目页面

Gitee Pages

制作示例和指南

百度aistudio
阿里天池

2. 特别感谢 @阿水

托管预训练模型文件

  1. 百度云
  2. 坚果云

增加了 在线论文编辑和分享环境 一项

  1. overleaf