從網絡圖探尋基因互作的蛛絲馬跡(1)
- 2019 年 10 月 6 日
- 筆記

抖音最火slogan:
「很多網友留言想看網絡圖,今天他來了,你看他一身華彩,絢麗多姿,別問落地價,因為paper無價!」。
網絡圖(Network)一直以來,受到眾多高分文章的追捧。它能夠簡潔、直觀地反應出Gene-Gene之間的相互作用關係,特別是能夠通過自身的拓撲結構突顯出某些核心的關鍵基因(Hub gene),就像下面這樣的。

有一次跟學員聊天,她說自己找外包公司做了一個蛋白互作的網絡圖,花了5000塊,做出來的圖還不好看,讓人氣憤的是,調整一下數據重新做個圖,又要5000塊!讓人無法接受。當時我就跟她說,做個互作網絡,根本花不了5000元,5分鐘就能幫你做好。不信,我們看過來。
所謂網絡圖,看似複雜,其實構成非常簡單。網絡圖是一種圖解模型,形狀如同網絡,故稱為網絡圖,它由節點(node)和連線(edge)兩個因素組成的。其中node又分為source node(源節點)和target node(目標節點)。這裡的node就是我們的基因,edge就是基因間的相互作用關係。任何網絡圖都不外乎這些構成成分。知道了網絡圖的構成之後,再做圖做分析就很簡單了。

下面我們就按照網絡圖的構成逐一進行講解:
節點(node)
所謂的節點,就是我們要分析的基因。在一個網絡圖當中往往有數十個乃至上百個節點,那就意味着,我們需要分析的基因有數十個或者上百個。這些基因是怎麼來的呢?這就跟我們的研究目的相關了,這些基因可能是我們篩選出來的差異表達的基因,可能是腫瘤患者中高頻突變的一些基因,也可能是某一個miRNA的下游靶基因,抑或僅僅是你感興趣的一群基因,都是可以的。
在進行網絡圖分析的時候,我們往往對基因的來源不做要求,只要是你認為有意義的一群基因,就OK了。但是,在基因的數量上,我們往往有一定的限制。因為,基因數少了,網絡圖中edge太少,圖做不出來,或者做出來很醜;而基因數多了,網絡圖太大,導致沒辦法導入軟件中進行分析,耗時太久,同時背景噪聲和混雜影響也會更多。因此,我個人一般建議的要分析的網絡圖基因數量在50-300個左右,這樣的網絡圖比較適中,不會太大,也不會太小。
連線(edge)
所謂的edge就是基因之間的相互作用關係。比如我隨便列舉兩個基因:TP53和CXCL12,這兩個基因是否有相互作用關係?我們通過何種方法進行判斷呢?這是一個比較困難的問題。好在,有一些非常好的數據庫幫我們解決了這一問題,比如最著名的就是STRING database。STRING (https://string-db.org/) 是一個非常全面的蛋白互作網絡數據庫,裏面存儲了非常多物種和基因的相互作用關係。我們只要把基因名字提交上去,就能夠判定它們之間是否有互作關係了。
下面,我們就從實例出發,教大家如何製作一個發表質量的網絡圖。
Part1
研究內容
分析處理組和對照組共得到100多個差異基因,分析其相互作用關係,並找到其中的關鍵基因。

(測試數據見文末,聯繫胖雨小姐姐)
看到這個研究內容,可能一下子有點懵,不要緊,我們先來理理思路:有了基因,我們得分析基因互作,這一步好辦,剛才已經講了STRING數據庫能做。那麼有了基因互作,我們怎麼做網絡圖?怎麼分析關鍵基因呢?這個時候,我們就需要一個軟件來幫我們實現了。 他是誰呢?大名鼎鼎的Cytoscape(Cytoscape最新版安裝包見文末,聯繫胖雨小姐姐)。
Cytoscape(https://cytoscape.org/)是一套完整的網絡圖分析系統,它不僅僅是個軟件,它還包含了一系列編程語言接口、app store等諸多內容,是網絡分析領域的龍頭老大。(突然發現,Cytoscape的主色調和我們科研貓居然是一致的,What a coincidence!)

Cytoscape能夠幫我們實現基因互作的可視化網絡圖,並且通過其諸多分析插件幫我們找到這裏面的關鍵基因,因此掌握Cytoscape之後,我們的這個問題就迎刃而解了。所以,理清思路之後,我們的研究方法如下。
part2
研究方法
利用String數據庫獲取基因相互作用網絡,並使用Cytosacpe軟件對網絡進行可視化和核心基因篩選。
那麼,我們的分析步驟也就一目了然了:
Step1: 從 基因列表 到 基因互作
Step2: 從 基因互作 到 互作網絡
Step3: 從 互作網絡 到 關鍵基因
先給大家看看我們的分析結果,後面的教程中,我們會帶領大家實際操作,逐一講解這裏面的分析步驟。

本期乾貨
·
網絡圖分析數據
&
Cytoscape安裝包
原文詳情:「科研貓」公眾號
以上內容均為「科研貓」公眾號原創,嚴禁未經許可擅自轉載及資源分享,如需轉載,請申請獲得許可。