手把手教你學會GO富集分析和弦圖繪製
- 2019 年 10 月 5 日
- 筆記
各位科研芝士的朋友,大家好。這周我們繼續分享關於數據可視化的教程,今天我們把自己的視線聚焦在富集分析上,一般大家會選擇DAVID在線工具或者y叔的神包clusterProfilter來操作,不管你選擇哪種富集方式,我們得到的GOterm,都需要進行可視化展示,這篇關於GOplot的教程也是大家一直碎碎念的教程,今天就分享給大家。
注意事項
GOplot包,該包主要是對GO富集結果進行可視化,不能進行富集分析。
下面進入正題,今天我們看看如何用富集分析的結果,進行GO可視化:
1
安裝並載入包,關於包的安裝,已經講過多次,直接上程式碼:

2
GO富集分析,這次利用clusterProfiler包進行富集分析,當然你還需要安裝該包並載入:

3
用內置數據集進行GO富集分析:

注意體會readable參數的意義,該參數的設置,可以是的GO富集的結果的gene以gene symbol形式出現。
4
轉成數據框的形式:

5
整理成GOplot所需要的輸入格式文件


分別是5列資訊,分別為GO的ID, Term名字,該Term所含的gene名,注意是gene symbol,以及p值還有所屬的類別 Category。5列的列名稱要注意不能輕易改動,分別為ID, Term,Genes,adj_pval和Category。
6
整理gene的資訊,該資訊要包括兩列資訊,分別是gene的Symbol還有就是gene的logFC值
首先用進行ID的轉換,從Entre ID轉成 Gene Symbol。

結果如下:

接著進行下面的操作,構造gene的data.frame:

這時候,gene的data.frame 如下:

7
構造和弦圖需要的輸入數據結構,首先是構建一個list對象,接著用circle_dat構建畫圖的對象circ2,接著用chord_dat構造chord對象,注意在process用了一個unique函數:

8
chord構建好之後,便可以輕鬆畫圖了,如下:

結果如下:

還可以使得gene 按照logFC排序:

結果如下:

當然還可以畫個熱圖:

結果如下:

OK,今天的推文就到這,我們分享了如何在基於clusterProfiler下,進行GO富集分析以及利用該GO富集結果進行GOplot可視化。