終極篇:3分鐘搞定GO/KEGG功能富集分析-柱狀圖
- 2019 年 10 月 6 日
- 筆記
在乾貨預警:3分鐘搞定GO/KEGG功能富集分析(2),給大家詳細講解了DAVID網站的使用,通過分步操作,帶領大家學習了使用DAVID工具來進行GO和KEGG分析。今天,我們重點講解如何將DAVID中的功能富集的結果轉換成正式的Figure,有請小獵豹。
多圖&多視頻預警,輕點可看詳細內容
在乾貨預警:3分鐘搞定GO/KEGG功能富集分析(2)文章的結尾,我們得到了一個基因列表的功能富集結果(如下圖所示)。但如果想把結果最展示在文章中(箭頭所指),還需要一些繪圖的操作。今天,我們就重點來講解 如何將DAVID中的功能富集的結果轉換成正式的Figure。

閱讀文獻時,大家遇到最多的就是柱狀圖(一般是水平柱狀圖),柱子的高低與p-value相關,柱子越高則越顯著。我也問過很多人,喜歡哪種圖片來展示功能富集的結果,曾經有人跟我說,特別喜歡那種大大小小的彩點圖……

我想了一下,覺得這位耿直的同學說的應該是高級氣泡圖,想必有不少人見過氣泡圖,卻不知道應該怎麼做,連現成的工具也找不到。那麼,今天的繪圖操作,我們就分為兩部分:柱狀圖 and 氣泡圖,來給大家詳細講講如何通過這兩種圖來展現GO/KEGG功能富集的結果。(由於微信公眾平台對視頻數目的限制,無奈把柱狀圖和氣泡圖分為兩篇講解,需要氣泡圖的同學請關注「科研貓」公眾號查看)
柱狀圖
本文所用的數據即上次演示DAVID操作時所用的數據(大家可以通過識別文末的二維碼,向「折耳貓小姐姐」索取)。話說柱狀圖的製作相當簡單,方法也眾多,比如Excel,Graphpad prism,SPSS,SAS,Matlab,R等眾多軟件,這裡我們就說最簡單實用的—Excel。下面是實戰演示,依舊是分步講解:
1
Step1:保存數據。將DAVID的結果保存到我們的本地電腦當中,保存文件我推薦用文本文件,即txt文件。原因是用各種編程語言和軟件處理起來比較方便。怎麼保存呢?非常簡單。在你的電腦文件夾中新建一個空白的文本文件,在結果頁面中點擊「Download File」,進入到結果詳情頁面,然後一次運行幾個快捷鍵即可,Ctrl+A(全選)- Ctrl+C(複製)-打開空白的文本文件- Ctrl+V(粘貼)- Ctrl+S (保存)- 關閉文本文件即可。
2
Step2:導入數據。打開Excel,導入數據,將文本文件導入Excel當中。這個步驟相信大家都能操作吧,如果是Windows系統,直接把文件拖過去就好了。為了避免有些時候打開不成功,我們通過「數據」-「自文本」的方法導入數據。
3
Step3:數據轉換。在作圖之前的我們需要對數據進行一定的處理。假定我們就按照最常見的水平柱狀圖來做,那麼圖片的x軸就是-log10(P value),我們需要使用函數把P value轉換一下,需要用到一個Excel當中的函數叫做-LOG10(),同時圖片的y軸是GO term或者KEGG pathway,這些語義詞彙的前綴都帶有GO:xxxxxxx~或者hsa:xxxxxx~,為了讓我們的figure更簡潔明了,我們需要把這些沒用的前綴刪除,怎麼刪掉呢?我們需要用到MID()函數。具體操作如下。
4
Step4:繪製圖形。得到轉換好的數據之後,我們就開始作圖啦!一般情況下,GO/KEGG富集出來的結果常規顯示top10或top15的數據,因此我們這裡選擇前10行展現出來。怎麼做呢?這個相信大家都會的,直接Excel中「插入」-「圖表」即可。
詳情:科研貓