chip_seq质量评估之FRiP Score

  • 2019 年 12 月 19 日
  • 筆記

欢迎关注”生信修炼手册”!

chip_seq是研究转录因子结合,组蛋白修饰的利器,这项技术虽然经过了很多年的发展,但是由于不同抗体的特异性,不同样本处理的复杂性,如何保证chip数据的高质量仍然是一个挑战。为了保证分析结果的可靠性,无论实验也好,分析也好,都需要一系列的质控指标,以保证最终结果的正确性。

ENCODE团队进行了大量的chip_seq数据分析,处理过来自人,小鼠等4个物种的超过100种细胞类型,140多种转录因子或者组蛋白的chip实验和分析,积累了丰富的经验,并最终总结出一份chip_seq指导手册,文章发表在Genome Research上,链接如下

https://genome.cshlp.org/content/22/9/1813.full

在这篇文章中从实验到数据分析都给出了很多的参考建议,本文主要讨论的是FRip Score这个质控指标。FRiP指的是fraction of all mapped reads that fall into peak regions. 代表peak区域内reads的比例,peak区域内的reads是抗体富集的序列,其他区域的序列是背景噪声。

只有mapping到基因组上的reads才会进行后续分析,所以直接用peak区域reads数目除以所有mapping基因组的数目,就得到了FRiP Score。Encode团队发现FRip Score和peak的个数存在正相关关系,结果如下

对于不同的转录因子chip数据,peak的个数不同,总体的趋势来看,peak的个数越多,FRiP Score的值越大。在Encode的chip数据集中,有80%左右的FRiP Score值都超过了1%,所以将1%看做是一个衡量chip实验的软标准。

之所以称之为软标准,是因为FRiP score低于1%并不能直接说明chip实验是失败的,高于1%也不能直接说明chip实验就是成功的。在ZNF274和RNA III型聚合酶的chip实验中,peak的个数很少,FRiP score的值也小于1%;在CTCF等转录因子实验中,FRiP score的值又远大于1%。

所以说FRiP score值是和特定的转录因子或者组蛋白修饰相关,在研究特定转录因子时,参考别人已经发表的数据中的FRiP Score作为衡量标准是更好的,在没有参考的情况下,可以用1%的阈值来作为一个软标准,为chip实验的质量提供一个参考。当peak个数的大于1000时,1%这个标准的效果还是比较好的,有相当大的参考意义。

·end·

—如果喜欢,快分享给你的朋友们吧—

扫描关注微信号,更多精彩内容等着你!