Aspera下載NCBI和EBI文件
- 2020 年 4 月 1 日
- 筆記
Aspera下載和安裝
Aspera下載: http://downloads.asperasoft.com/connect2/。
wget http://d3gcli72yxqn2z.cloudfront.net/connect/bin/aspera-connect-3.5.1.92523-linux-64.tar.gz tar zxf aspera-connect-3.5.1.92523-linux-64.tar.gz sh aspera-connect-3.5.1.92523-linux-64.sh echo 'PATH=$PATH:~/.aspera/connect/bin/' >> ~/.bashrc source ~/.bashrc ascp --help
軟件一般安裝在 ~/.aspera/connect/ 目錄下。
Aspera使用: 使用說明:https://www.internationalgenome.org/faq/how-download-files-using-aspera
Aspera 高速下載 NCBI或 EBI 上的數據:
1.EBI 數據下載:
ascp -T -l 200M -i ~/.aspera/connect/etc/asperaweb_id_dsa.openssh --host=fasp.sra.ebi.ac.uk --user=era-fasp --mode=recv /vol1/fastq/ERR105/ERR105009/ERR105009_1.fastq.gz ./ #或者 ascp -T -l 200M -i ~/.aspera/connect/etc/asperaweb_id_dsa.openssh [email protected]:/vol1/fastq/ERR105/ERR105009/ERR105009_1.fastq.gz ./
2.NCBI數據下載:
ascp -T -l 200M -i ~/.aspera/connect/etc/asperaweb_id_dsa.openssh --host=ftp-private.ncbi.nlm.nih.gov --user=anonftp --mode=recv /sra/sra-instant/reads/ByRun/sra/ERR/ERR105/ERR105009/ERR105009.sra ./ #或者 ascp -T -l 200M -i ~/.aspera/connect/etc/asperaweb_id_dsa.openssh [email protected]:/sra/sra-instant/reads/ByRun/sra/ERR/ERR105/ERR105009/ERR105009.sra ./
主要參數: -v verbose mode 詳細模式,顯示運行記錄 -T 不進行加密。若不添加此參數,可能會下載不了。 -i 免密從SRA和ENA下載的私鑰,為·安裝 aspera 後有在目錄 ~/.aspera/connect/etc/ 下的asperaweb_id_dsa.openssh 文件。 -l 設置最大傳輸速度,一般200m到500m,默認似乎是10m/s的速度,比較慢 -k 斷點續傳,一般設置為值1 -P 用於SSH身份驗證的TCP端口,一般是33001 –host=string ftp的host名,NCBI的為ftp-private.ncbi.nlm.nih.gov;EBI的為fasp.sra.ebi.ac.uk。 –user=string 用戶名,NCBI的為anonftp,EBI的為era-fasp。 –mode=string 選擇模式,上傳為 send,下載為 recv。
歡迎關注~
參考: https://zhuanlan.zhihu.com/p/39387340 https://www.jianshu.com/p/f16ed4c79739 https://ngs-data-for-pathogen-analysis.readthedocs.io/zh_CN/latest/chapter_01/01_get_data.html https://blog.csdn.net/herokoking/article/details/76530517