終極篇:3分鐘搞定GO/KEGG功能富集分析-氣泡圖

  • 2019 年 10 月 6 日
  • 筆記

乾貨預警:3分鐘搞定GO/KEGG功能富集分析(2),給大家詳細講解了DAVID網站的使用,通過分步操作,帶領大家學習了使用DAVID工具來進行GO和KEGG分析。今天,我們重點講解如何將DAVID中的功能富集的結果轉換成正式的Figure,有請小獵豹。

多圖&多影片預警,輕點可看詳細內容

乾貨預警:3分鐘搞定GO/KEGG功能富集分析(2)文章的結尾,我們得到了一個基因列表的功能富集結果(如下圖所示)。但如果想把結果最展示在文章中(箭頭所指),還需要一些繪圖的操作。今天,我們就重點來講解 如何將DAVID中的功能富集的結果轉換成正式的Figure

閱讀文獻時,大家遇到最多的就是柱狀圖(一般是水平柱狀圖),柱子的高低與p-value相關,柱子越高則越顯著。我也問過很多人,喜歡哪種圖片來展示功能富集的結果,曾經有人跟我說,特別喜歡那種大大小小的彩點圖……

我想了一下,覺得這位耿直的同學說的應該是高級氣泡圖,想必有不少人見過氣泡圖,卻不知道應該怎麼做,連現成的工具也找不到。那麼,今天的繪圖操作,我們就來給大家詳細講講如何通過氣泡圖來展現GO/KEGG功能富集的結果。(由於微信公眾平台對影片數目的限制,無奈把柱狀圖和氣泡圖分為兩篇講解,需要柱狀圖教程的同學請關注「科研貓」公眾號查看)。

氣泡圖

氣泡圖的製作相當複雜,如果手上有現成的文獻使用了氣泡圖來表徵功能富集分析的結果,也可以拿出來看一下。首先我們看x軸是Gene Ratio,對應的就是DAVID結果表格中的「%」一列;y軸是富集出來的通路或者GO Term;點的大小表示Gene數;點的顏色最為重要,代表P值的高低。

所以,圖確實很好看,但是做起來實屬不易,目前還沒有遇到有現成的繪圖軟體可以幫我們做這樣的圖片。那怎麼辦呢?嘿嘿,讓小獵豹來教教大家吧。前面的推文中,我們也講解過R語言,R語言可以說是目前最為流行、最為強大的統計繪圖工具,相信我們大家都聽說過。即使你對R語言了解不深,不要緊,我們幫大家把程式碼都寫好了,直接運行即可。如果你還沒有安裝R語言,請參考我們前面的推文(生物資訊系列課程-R語言入門)。在運行這個R程式碼之前呢,需要安裝兩個R包ggplot2和Hmisc,然後直接運行bubblePlot.R即可。具體運行過程可見下面短影片,可謂一氣呵成,無需數據轉換等繁瑣步驟,而且最終生成的圖極其細緻,把首字母大寫,欄位截取,數字下標等細節都做好了。

相信有不少同學對R語言還是不太熟悉,在運行程式碼的過程當中可能還會遇到不同的問題,可以在文末的留言板中留言哦,小獵豹會及時幫大家解決的。再次強調,操作所需的程式碼(話說這個程式碼曾經買到幾百塊哦)和測試數據可免費獲取,識別文末二維碼,聯繫折耳貓小姐姐即可。

到現在為止,關於GO/KEGG功能富集分析就講完了。我啰哩啰嗦地分了三篇文章來給大家講解,主要目的是為了讓大家徹底搞懂功能富集分析的含義,並掌握具體的操作步驟。當大家真正熟悉了以後,實際操作大概在幾分鐘時間就可以完成。為了讓大家把前面的操作都串聯起來,方便學習記憶,在這裡我把功能富集分析的一整套操作錄製成影片,希望大家能夠真正掌握這一實用分析。

原文詳情:科研貓