Aspera下载NCBI和EBI文件
- 2020 年 4 月 1 日
- 筆記
Aspera下载和安装
Aspera下载: http://downloads.asperasoft.com/connect2/。
wget http://d3gcli72yxqn2z.cloudfront.net/connect/bin/aspera-connect-3.5.1.92523-linux-64.tar.gz tar zxf aspera-connect-3.5.1.92523-linux-64.tar.gz sh aspera-connect-3.5.1.92523-linux-64.sh echo 'PATH=$PATH:~/.aspera/connect/bin/' >> ~/.bashrc source ~/.bashrc ascp --help
软件一般安装在 ~/.aspera/connect/ 目录下。
Aspera使用: 使用说明:https://www.internationalgenome.org/faq/how-download-files-using-aspera
Aspera 高速下载 NCBI或 EBI 上的数据:
1.EBI 数据下载:
ascp -T -l 200M -i ~/.aspera/connect/etc/asperaweb_id_dsa.openssh --host=fasp.sra.ebi.ac.uk --user=era-fasp --mode=recv /vol1/fastq/ERR105/ERR105009/ERR105009_1.fastq.gz ./ #或者 ascp -T -l 200M -i ~/.aspera/connect/etc/asperaweb_id_dsa.openssh [email protected]:/vol1/fastq/ERR105/ERR105009/ERR105009_1.fastq.gz ./
2.NCBI数据下载:
ascp -T -l 200M -i ~/.aspera/connect/etc/asperaweb_id_dsa.openssh --host=ftp-private.ncbi.nlm.nih.gov --user=anonftp --mode=recv /sra/sra-instant/reads/ByRun/sra/ERR/ERR105/ERR105009/ERR105009.sra ./ #或者 ascp -T -l 200M -i ~/.aspera/connect/etc/asperaweb_id_dsa.openssh [email protected]:/sra/sra-instant/reads/ByRun/sra/ERR/ERR105/ERR105009/ERR105009.sra ./
主要参数: -v verbose mode 详细模式,显示运行记录 -T 不进行加密。若不添加此参数,可能会下载不了。 -i 免密从SRA和ENA下载的私钥,为·安装 aspera 后有在目录 ~/.aspera/connect/etc/ 下的asperaweb_id_dsa.openssh 文件。 -l 设置最大传输速度,一般200m到500m,默认似乎是10m/s的速度,比较慢 -k 断点续传,一般设置为值1 -P 用于SSH身份验证的TCP端口,一般是33001 –host=string ftp的host名,NCBI的为ftp-private.ncbi.nlm.nih.gov;EBI的为fasp.sra.ebi.ac.uk。 –user=string 用户名,NCBI的为anonftp,EBI的为era-fasp。 –mode=string 选择模式,上传为 send,下载为 recv。
欢迎关注~
参考: https://zhuanlan.zhihu.com/p/39387340 https://www.jianshu.com/p/f16ed4c79739 https://ngs-data-for-pathogen-analysis.readthedocs.io/zh_CN/latest/chapter_01/01_get_data.html https://blog.csdn.net/herokoking/article/details/76530517