征集 | 用于发布研究论文代码的国内优质资源(软件、平台、服务)
- 2020 年 12 月 18 日
- AI
为了促进机器学习项目的可重复性,我们需要能够提高交流科研成果的效率工具(不限于软件、网站或平台)
本次征集工作的意义详见:发布研究论文代码的小技巧
征集工作结果将作为开源项目发布于 datawhalechina/releasing-research-code
现在需要做的是,补全该文档的【国内部分】。
恳求各位的帮助,提高国内的科研工作交流效率。
国外工具参考
网盘
用途:托管预训练模型文件
- Zenodo – 支持版本管理,50GB,带宽免费,DOI,可长期保存
- GitHub Releases – 支持版本管理,2GB 文件大小限制,带宽免费
- OneDrive – 支持版本管理,2GB(免费 )/ 1TB (需要Office 365套装),带宽免费
- Google Drive – 支持版本管理,15GB,带宽免费
- Dropbox – 支持版本管理,2GB(付费无限容量),带宽免费
- AWS S3 – 支持版本管理,仅付费使用,带宽需付费
管理模型文档
- RClone – 针对众多不同的云存储提供商,提供统一访问方案
标准化模型接口
指标排行榜
- Papers with Code leaderboards – with 2500+ leaderboards
- CodaLab – with 450+ leaderboards
- NLP Progress – with 90+ leaderboards
- EvalAI – with 50+ leaderboards
- Collective Knowledge – with 40+ leaderboards
- Weights & Biases – Benchmarks – with 9+ leaderboards
网页制作
用途:制作项目页面
代码在线交互+算力平台
用途:制作示例和指南
参与方式(如下任何方便的方式)
欢迎以任何方式参与到研究项目开源工具征集中,为促进科研成果交流而努力。
征集 | 用于发布研究论文代码国内优质资源(软件、平台、服务)
- 直接评论本篇文章
2. 直接编辑在线表格:腾讯文档
3. 直接编辑在线文档:无标题文档
4. 直接填写调查问卷:问卷系统
注:以评论和问卷形式优先,方便记录贡献者的信息。
恳请人工智能领域、科研领域和开源领域的师长和朋友们提供建议!
致谢(本开源项目完成后,会逐一记录所有提供了建设性意见的朋友)
- 特别感谢 @P小二
托管预训练模型文件
托管大文件,基本都是各种网盘,百度网盘,360网盘,不付费速度比较慢。
码云附件最大100MB,根本不够存。
还有各大云服务器商的存储分发服务,这个收费比较贵。
托管预训练模型文件
国内没有这种服务,只是一个多个存储服务的同步服务,这个可以可以写。
标准化模型接口
PaddleHub
MegEngine Model Hub
指标排行榜
中文语言理解基准测评(CLUE) //www.cluebenchmarks.com/index.html
制作项目页面
Gitee Pages
制作示例和指南
百度aistudio
阿里天池
2. 特别感谢 @阿水
托管预训练模型文件
- 百度云
- 坚果云
增加了 在线论文编辑和分享环境 一项