chip_seq質量評估之coverage分析
- 2019 年 12 月 19 日
- 筆記
歡迎關注」生信修鍊手冊」!
peak calling的核心是比較input和抗體處理樣本基因組區域測序深度分佈的差異,所以樣本的測序深度分佈可以作為質控的一個標準,本文介紹如何通過deeptools來繪製樣本測序深度分佈圖。
通過plotCoverage
命令,可以繪製樣本測序深度的分佈,由於測序量較大,為看節省運行時間,默認隨機抽取10M的reads,來計算測序深度的分佈,基本用法如下
plotCoverage -b H3K4Me1.bam H3K4Me3.bam H3K27Me3.bam H3K9Me3.bam --plotFile example_coverage -n 1000000 --plotTitle "example_coverage" --outRawCounts coverage.tab --ignoreDuplicates --minMappingQuality 10
輸出結果示意如下

左側是測序深度頻率分佈圖,右側是大於該測序深度的頻率分佈圖, 以H3K4Me1
這個樣本為例,左側圖中橫坐標為2的位置,對應縱坐標約為0.05,說明測序深度為2的區域包含了5%的reads,右側圖中橫坐標為2的位置,對應的縱坐標約為0.15, 說明在基因組上有15%的區域測序深度都大於等於2。
這種頻率分佈圖單個樣本實際上意義不大,主要是通過多個樣本的比較,查看是否有某個樣本和其他樣本差距很大,從而判斷離群值樣本。
·end·
—如果喜歡,快分享給你的朋友們吧—
掃描關注微信號,更多精彩內容等着你!