SEdb:超級增強子資料庫簡介

  • 2019 年 12 月 19 日
  • 筆記

歡迎關注」生信修鍊手冊」!

增強子作為基因組上的順式作用元件,在調控網路中發揮重要作用。隨著研究的不斷深入,科學家提出了超級增強子super-enhancer的概念,將基因組上富集了增強子的區域定義為超級增強子。

類似於將富集CpG位點的區域定義為CpG島,這種將富集某種元件的區域單獨定義並進行研究的思想在生物學領域非常常見,體現了不同元件功能層次的多樣性,由單個位點到一組位點,這種功能研究的層次性也對應了生命體複雜的調控機制。

和增強子的研究類似,對於超級增強子,也是研究其在不同生物學過程,疾病發生髮展等過程中的調控作用。SEdb是一個綜合性的超級增強子資料庫,文章發表在Nucleic Acids Research上,鏈接如下

https://academic.oup.com/nar/article/47/D1/D235/5146197

該資料庫的網址如下

http://www.licpathway.net/sedb/

採用了H3K27ac這種組蛋白修飾作為增強子區的標記,利用從ENCODE, RoadMap, GEO等公共資料庫中下載的H3K27ac chip_seq數據,首選採用MACS識別增強子區,然後採用ROSE這款軟體來識別超級增強子區。

對於識別到的超級增強子區,利用bedtools進行下列注釋

  1. SNP位點 從dbSNP資料庫下載SNP位點,利用1000G的數據對SNP位點進行連鎖不平衡分析,同時從GWAS Catalog和GWASdb下載疾病相關的risk SNP位點資訊,注釋在超級增強子區域記憶體在的各種SNP位點。
  2. DHS 從UCSC和ENCODE下載DNase酶超敏區域資訊,進行注釋
  3. Enhancers 從ENCODE和FANTOM5下載增強子區域資訊,進行注釋
  4. TFBS 從UCSC下載轉錄因子結合位點的資訊,進行注釋
  5. CRISPR/Case9 target sites 從UCSC下載基因編輯位點資訊,進行注釋
  6. eQTLs 從GTEx, HaploReg和PancanQTL資料庫中下載eQTL-gene關係對,進行注釋
  7. motif change 從TRANSFAC和JASPAR資料庫下載轉錄因子的motif資訊,利用atSNP這個R包計算SNP位點對motif的影響

除了對超級增強子進行注釋外,還通過6種不同策略對超級增強子的靶基因進行預測,所有的注釋資訊和靶基因預測結果都可以通過資料庫檢索進行查詢和瀏覽。

考慮到超級增強子的特異性,所有的數據都是以單個樣本的形式進行分析和存儲的,示意如下

點擊樣本編號可以查看單個樣本的超級增強子資訊,首先是樣本的基本資訊和超級增強子在不同染色體上的分布,示意如下

接下來是超級增強子的列表,示意如下

點擊第一列的ID,可以查看詳細資訊

1. Overview

2. Annotation

3. target gene

4. enhancer

5. overlap with super-hancers

除了基本的檢索和瀏覽功能外,該資料庫還提供了很多的在線工具,數據也是開放下載的,更多的用法請參考官網的幫助文檔。

·end·

—如果喜歡,快分享給你的朋友們吧—

掃描關注微訊號,更多精彩內容等著你!