從網路圖探尋基因互作的蛛絲馬跡(4)

  • 2019 年 10 月 6 日
  • 筆記

在前面的3期中,我們給大家講解了網路圖的構造、 STRING資料庫和Cytoscape軟體的安裝,鏈接如下:

從網路圖探尋基因互作的蛛絲馬跡(1)

【科研貓·繪圖】從網路圖探尋基因互作的蛛絲馬跡(2)

從網路圖探尋基因互作的蛛絲馬跡(3)

還記得我們的研究課題嗎?

如何從100多個差異表達的基因當中快速鎖定關鍵基因

這個課題的分析步驟分了幾個步驟:

1、從基因列表蛋白互作

2、從蛋白互作互作網路

3、從互作網路關鍵基因

我們已經完成了第一步,並且在 STRING 資料庫當中繪製了一個簡單的網路圖,可惜這個網路圖沒有辦法進一步在 STRING 當中進行美化,也沒辦法通過演算法找到裡面的關鍵基因,怎麼辦呢?

這時候就依賴 Cytoscape 了,關於 Cytoscape 的軟體簡介和安裝調試我們已經講過了,這次,我們就來演示最關鍵的內容,Cytoscape的使用。我們還是從上次的實例出發,邊演示邊講解。

Attention

軟體操作略複雜,

因此文末配備了超長無碼講解影片。

文件導入

網路文件格式包括多種格式:TXT、SIF、GML等,這些都是 Cytoscape 能夠識別的,其中最常用的就是 TXT 文本文件。這種格式是最簡單的,其實就是從 Excel 中複製出來的表格,其格式是這樣的:

(1)第一行,默認作為列名,所以不要有重複性的名字;從第二行開始就是結點(node)之間的相互作用關係了;

(2) 數據至少包含兩列,第一列是Source Node,第二列是Target Node;

就拿我們從STRING生成的網路圖源文件為例,我們生成的是一個名為string_interactions.tsv的文件,這是一個文本文件,我們用Excel把它打開之後是這樣子的:

導入文件怎麼導入呢?打開Cytosacpe,找到 File-Import-Network from File 即可導入文件。

點擊導入文件,找到你的網路源文件,也就是我們這裡的 string_interactions.tsv 文件,導入之後是這樣的,軟體會自動幫我們識別最重要的兩列:Source node和 Target node,一般就是前面兩列,一般識別的都是對的。

如果識別的不對,很簡單,點擊一下表頭,會有個下拉菜單,我們自己選擇、自己指定就行。除了Source Node、Target Node,其他列數據的屬性還包括Interaction Type、Edge Attribution、Source Attribution、Target Attribution 等,同時對應不同顏色和圖標標記。

指定好數據列之後,點擊OK即可,數據導入到此為止,軟體會自動生成一個網路圖。

頁面布局

Cytoscape是一個非常龐大的軟體,其功能非常豐富,頁面布局也比較複雜,在我們導入了網路圖數據之後呢,它會直接幫我們生成一個網路圖,其頁面如下:

由此可見,頁面相當複雜,而其中我們最常用的區域就是兩個:控制面板網路圖區。控制面板是我們用的最多的地方,這裡面至少包括了三個子面板:

(1) Network: 網路圖列表,這裡以樹形圖的方式羅列了我們打開的所有網路圖

(2) Style: 外觀可視化控制面板,這個面板控制了我們的網路圖外觀,所有的外觀設置都在這個裡面,這個面板也包括了三個子面板:

a) Node: 控制節點的外觀,包括大小、顏色、形狀等,使用頻率很高;

b) Edge: 控制連線的外觀,包括顏色、粗細等,使用頻率很高

c) Network: 控制網路圖的外觀,如背景色等,使用較少;

(3) Select: 篩選,即從整個網路圖當中按照用戶的要求去選定特Node或者Edge。這個功能用的也是比較多的。

整個Cytoscape頁面布局中最重要的就是控制面板,而通過控制面板中特定屬性的設置,我們就可以隨心所欲地改變網路圖的外觀了。

應用商店

Cytoscape的菜單欄中有很多的功能欄,而我唯獨要講一講這裡面的 Apps 這一欄。Apps 就像我們手機上面的應用商城一樣,提供了非常多的功能插件,它使得 Cytoscape 的功能根據用戶的需求無限延伸,而且最重要的是,這裡所有的插件都是免費的哦~,如下圖所示:

後續我們篩選關鍵基因、進行功能富集都是在這個裡面選取特定的插件實現的,所以Apps這個菜單欄也是極其重要的。

回到我們的研究課題當中,如何導入數據並實現高級的可視化操作呢?具體的步驟我這裡就不一一羅列了,大家可以看文末的影片或者可以來參加我們近期的線下課程【線下·上海】實用生物資訊與數據挖掘系列課程,到時候會手把手一步步地教大家怎麼從一堆沒有頭緒的數據到一篇完整的SCI文章。

總之Cytoscape是一個非常龐大實用的軟體,它裡面隱藏了非常多的功能,建議大家有時間可以去閱讀一下Cytoscape的官方說明。

到這裡,我們的研究課題的三大步:

1、從基因列表蛋白互作(已完成)

2、從蛋白互作互作網路(已完成)

3、從互作網路關鍵基因

已經順利完成前面兩步了,下節教程我們講解第三個步驟,如何從蛋白互作的網路鎖定關鍵基因。

本期乾貨

Cytoscape實操詳解

原文詳情:「科研貓」公眾號

科研貓原創系列,未經許可嚴禁轉載,版權事宜由上海辰明律師事務所提供法務支援。