【科研貓·繪圖】bar(霸)圖繪製之霸氣滿屏

  • 2019 年 10 月 6 日
  • 筆記

如果一篇科研論文沒有 bar圖,那它可能就不是一篇合格的科研論文。

很多同學也許會問,bar圖有什麼難的,我科研論文做第一張圖就是bar圖,so~so~easy。

其實bar圖也有很多種的,最大的差別,就是我們家的 bar圖和別人家的bar圖

為什麼別人家的 bar圖可以上CNS,我們家的bar圖match卻只能在一兩分的角落裡畫圈圈呢

當然實驗設計和內容絕對佔99.99%因素,可是縱覽所有高分論文,可以有灌水的文章,卻沒有不好看的圖。很多同學可能遇到這種情況,論文投稿後,reviewer的意見就有:親,圖能否做得更規範(更好看,更美觀)些?

在我們閱讀過的科研論文中,幾乎所有的文章都包含bar圖,因此bar圖可謂是霸氣滿屏,科研一姐。那麼如何繪製一張美麗的bar圖呢,就讓飛飛老師帶領大家一起學習一下吧~

好了,老規矩,我們先講解一下什麼是bar圖。今天給大家演示的Bar圖很簡單,只有兩列,一列是坐標軸內容,一列是數值,非常容易理解。

首先我們先看一下輸入的數據格式,作為示例,我們選取了功能富集分析的結果作為實例練習(聯繫文末胖雨小姐姐,獲取測試數據)。

輸入文件只有三列,第一列是通路的名字,第二列是通路的類型,第三列是富集資訊。在實驗中我們將差異基因進行富集,用來表示差異基因主要集中於哪些通路中,值越高,說明該通路的富集越顯著

而我們要展示的,就是如何用這樣三列簡單資訊,畫一張不簡單的bar圖。

首先安裝R包,在這裡我們要用到繪圖神器 ggpubr 這個包,教程見http://www.sthda.com/english/articles/24-ggpubr-publication-ready-plots/。另外由於我們的輸入數據是 excel 格式的,所以需要用 openxlsx 這個工具讀取excel 裡面的資訊。

包安裝並載入完成後,我們就開始畫圖啦。第一步讀取excel裡面的通路富集資訊。並查看文件前6行。

從R裡面可以看到,我們文件分為三列,第一列是通路的名字,第二列是通路的類型,類型有三種,分別是 SignalingMetabolismOther,第三列是富集的分值,分值越高,說明這個通路越顯著。

然後,就可以開始畫圖啦。X軸為Name,Y軸為Score。

何止是有點丑,簡直不忍直視!

所以,我們需要對這張圖進行美化,做成論文發表的格式,不要給reviewer拒我們的理由。

整容第一步:為各通路著色

這樣看,效果確實好多了。當然,我們通路分為三種類型,而這張圖的通路類型是混合在一起的,所以我們需要對通路的順序進行調整,讓圖看上去更整潔明了。

整容第二步:調整通路順序

這樣看上去就好很多了。事實上,許多文章的圖到這一步就結束了,而這樣的圖,剛好也在reviewer接受的範圍內。

但是,這充其量也只是個淡妝,怎麼能讓 reviewer 眼前一亮呢?我們還需要對圖的顏色和布局進行改進。

整容第三步:調整顏色和布局

在通路中,我們想最先展示 Signaling,然後展示 Metabolism,最後展示不是那麼重要的 Others。所以我們要將 Pathway 這一列改成因子型。同時更改 bar的顏色,讓整體顏色更加協調美觀。

下面是見證奇蹟的時刻!

這個顏色是不是看上去十分高大上~

要知道,這可是The New England Journal of Medicine鍾愛的色彩搭配、時尚穿搭!

當然,整體來看,這張圖還有很多細節不夠(這可能是一個強迫症晚期作圖愛好者的 solo),所以我們修改了坐標軸範圍和邊框,讓bar圖直接呈現出可供NEJM 發表的效果。

恩,讓我們繼續見證奇蹟的誕生(*^▽^*)

這樣的一張 bar 圖,比例合理,表述內容明確,顏色協調,而且風格和 NEJM雜誌很搭哦~ 所以,同學們趕緊來試一試吧,實現頂刊的夢想,從第一張完美bar圖開始!

今天,飛飛老師就跟大家講到這裡,下次我們再講更多漂亮的繪圖。

本期乾貨

Bar圖繪製程式碼&測試數據

原文詳情「科研貓」公眾號

科研貓原創系列,未經許可嚴禁轉載,版權事宜由上海辰明律師事務所提供法務支援。