chip_seq質量評估之FRiP Score

  • 2019 年 12 月 19 日
  • 筆記

歡迎關注」生信修鍊手冊」!

chip_seq是研究轉錄因子結合,組蛋白修飾的利器,這項技術雖然經過了很多年的發展,但是由於不同抗體的特異性,不同樣本處理的複雜性,如何保證chip數據的高質量仍然是一個挑戰。為了保證分析結果的可靠性,無論實驗也好,分析也好,都需要一系列的質控指標,以保證最終結果的正確性。

ENCODE團隊進行了大量的chip_seq數據分析,處理過來自人,小鼠等4個物種的超過100種細胞類型,140多種轉錄因子或者組蛋白的chip實驗和分析,積累了豐富的經驗,並最終總結出一份chip_seq指導手冊,文章發表在Genome Research上,鏈接如下

https://genome.cshlp.org/content/22/9/1813.full

在這篇文章中從實驗到數據分析都給出了很多的參考建議,本文主要討論的是FRip Score這個質控指標。FRiP指的是fraction of all mapped reads that fall into peak regions. 代表peak區域內reads的比例,peak區域內的reads是抗體富集的序列,其他區域的序列是背景噪聲。

只有mapping到基因組上的reads才會進行後續分析,所以直接用peak區域reads數目除以所有mapping基因組的數目,就得到了FRiP Score。Encode團隊發現FRip Score和peak的個數存在正相關關係,結果如下

對於不同的轉錄因子chip數據,peak的個數不同,總體的趨勢來看,peak的個數越多,FRiP Score的值越大。在Encode的chip數據集中,有80%左右的FRiP Score值都超過了1%,所以將1%看做是一個衡量chip實驗的軟標準。

之所以稱之為軟標準,是因為FRiP score低於1%並不能直接說明chip實驗是失敗的,高於1%也不能直接說明chip實驗就是成功的。在ZNF274和RNA III型聚合酶的chip實驗中,peak的個數很少,FRiP score的值也小於1%;在CTCF等轉錄因子實驗中,FRiP score的值又遠大於1%。

所以說FRiP score值是和特定的轉錄因子或者組蛋白修飾相關,在研究特定轉錄因子時,參考別人已經發表的數據中的FRiP Score作為衡量標準是更好的,在沒有參考的情況下,可以用1%的閾值來作為一個軟標準,為chip實驗的質量提供一個參考。當peak個數的大於1000時,1%這個標準的效果還是比較好的,有相當大的參考意義。

·end·

—如果喜歡,快分享給你的朋友們吧—

掃描關注微信號,更多精彩內容等着你!