徵集 | 用於發布研究論文程式碼的中國優質資源(軟體、平台、服務)

  • 2020 年 12 月 18 日
  • AI

為了促進機器學習項目的可重複性,我們需要能夠提高交流科研成果的效率工具(不限於軟體、網站或平台)
本次徵集工作的意義詳見:發布研究論文程式碼的小技巧
徵集工作結果將作為開源項目發佈於 datawhalechina/releasing-research-code

現在需要做的是,補全該文檔的【中國部分】。

懇求各位的幫助,提高中國的科研工作交流效率。

國外工具參考

網盤

用途:託管預訓練模型文件

  1. Zenodo – 支援版本管理,50GB,頻寬免費,DOI,可長期保存
  2. GitHub Releases – 支援版本管理,2GB 文件大小限制,頻寬免費
  3. OneDrive – 支援版本管理,2GB(免費 )/ 1TB (需要Office 365套裝),頻寬免費
  4. Google Drive – 支援版本管理,15GB,頻寬免費
  5. Dropbox – 支援版本管理,2GB(付費無限容量),頻寬免費
  6. AWS S3 – 支援版本管理,僅付費使用,頻寬需付費

管理模型文檔

  1. RClone – 針對眾多不同的雲存儲提供商,提供統一訪問方案

標準化模型介面

  1. PyTorch Hub
  2. Tensorflow Hub
  3. Hugging Face NLP models
  4. ONNX

指標排行榜

  1. Papers with Code leaderboards – with 2500+ leaderboards
  2. CodaLab – with 450+ leaderboards
  3. NLP Progress – with 90+ leaderboards
  4. EvalAI – with 50+ leaderboards
  5. Collective Knowledge – with 40+ leaderboards
  6. Weights & Biases – Benchmarks – with 9+ leaderboards

網頁製作

用途:製作項目頁面

  1. GitHub pages
  2. Fastpages

程式碼在線交互+算力平台

用途:製作示例和指南

  1. Google Colab
  2. Binder
  3. Streamlit


參與方式(如下任何方便的方式)

歡迎以任何方式參與到研究項目開源工具徵集中,為促進科研成果交流而努力。

徵集 | 用於發布研究論文程式碼中國優質資源(軟體、平台、服務)

  1. 直接評論本篇文章

2. 直接編輯在線表格:騰訊文檔

3. 直接編輯在線文檔:無標題文檔

4. 直接填寫調查問卷:問卷系統

註:以評論和問卷形式優先,方便記錄貢獻者的資訊。

懇請人工智慧領域、科研領域和開源領域的師長和朋友們提供建議!


致謝(本開源項目完成後,會逐一記錄所有提供了建設性意見的朋友)

  1. 特別感謝 @P小二

託管預訓練模型文件

託管大文件,基本都是各種網盤,百度網盤,360網盤,不付費速度比較慢。
碼雲附件最大100MB,根本不夠存。
還有各大雲伺服器商的存儲分發服務,這個收費比較貴。

託管預訓練模型文件

中國沒有這種服務,只是一個多個存儲服務的同步服務,這個可以可以寫。

標準化模型介面

PaddleHub
MegEngine Model Hub

指標排行榜

中文語言理解基準測評(CLUE) cluebenchmarks.com/inde

製作項目頁面

Gitee Pages

製作示例和指南

百度aistudio
阿里天池

2. 特別感謝 @阿水

託管預訓練模型文件

  1. 百度雲
  2. 堅果雲

增加了 在線論文編輯和分享環境 一項

  1. overleaf