HLA NGS數據分析
- 2020 年 3 月 3 日
- 筆記
主要是參考這個進行的,https://github.com/humanlongevity/HLA 其文章在這:http://www.pnas.org/content/early/2017/06/27/1707945114
首先是拿到fastq文件,然後進行了下fastqc質控,發現質量不咋地,死馬當活馬醫,試試。

然後是bwa比對,先是
bwa index /home/biolinux/reference/hg38.fa #建立索引 bwa mem /home/biolinux/reference/hg38.fa /home/biolinux/Downloads/HLA.fastq > hla.sam #然後比對 samtools view -S hla.sam -b > hla.bam #格式轉換 samtools sort hla.bam hla_sorted.bam # 排序 samtools index hla_sorted.bam # 索引
最後,進行xhla算法比對。

docker run -v `pwd`:`pwd` -w `pwd` humanlongevity/hla --sample_id test --input_bam_path hla.bam --output_path test
得出結果,一個比較疑惑的地方是hg38(without alt contigs)沒搞懂。有待解決。


{ "subject_id": "test", "creation_time": "2017-09-19T07:09:32Z", "report_version": "1.2", "report_type": "hla_typing", "sample_id": "test", "hla": { "alleles": [ "A*24:290", "A*24:290", "C*07:02", "C*07:02", "DPB1*13:01", "DPB1*33:01", "DQB1*06:11", "DQB1*06:39", "DRB1*15:01", "DRB1*16:01" ] }}