【科研貓·繪圖】從網路圖探尋基因互作的蛛絲馬跡(2)
- 2019 年 10 月 6 日
- 筆記
前面一期 從網路圖探尋基因互作的蛛絲馬跡(1) (此鏈接可入)中我們給大家講解了網路圖的構造,以及在文章當中構建網路圖需要用到的兩個資源:STRING資料庫和Cytoscape軟體。
我們還給大家出了一個研究課題:如何從100多個差異表達的基因當中快速鎖定重要的關鍵基因。這個課題的分析步驟分了如下幾個步驟:
1、從基因列表到蛋白互作;
2、從蛋白互作到互作網路;
3、從互作網路到關鍵基因。
今天我們先來看第一步:如何從一堆基因構建一個蛋白互作網路。
很多請公司做過類似分析的都知道,這是一個價值上千的分析項目,但是實際操作並不困難,分分鐘就可以帶大家搞定。不說閑話,直接上手。

【溫馨提示】傾情大放送,文末影片教程,手把手教學!
Step1:準備基因列表
這個基因列表的文件說白了就是一列基因,對於基因的數量我們略作要求,在50-300個左右(具體原因,上期跟大家說過了)。在我們的學習資料中,給大家準備了這個研究課題所需的資料,其中有一個差異基因的列表。有些同學可能不知道哪裡領取資料,這裡再跟大家說一下,學習資料見文末,找胖雨小姐姐。

Step2:打開STRING資料庫
STRING資料庫的網址:https://string-db.org/。
STRING要跟大家詳細的講解一下,這是一個搜尋已知蛋白質之間和預測蛋白質之間相互作用的系統。這種相互作用既包括蛋白質之間直接的物理的相互作用,也包括蛋白質之間間接的功能的相關性,是目前最為全面、最為權威的蛋白相互作用資料庫。
它除了包含有實驗數據、從PubMed摘要中文本挖掘的結 果和綜合其他資料庫數據外,還有利用生物資訊學的方法預測的結果。所應用的生物資訊學的方法有:染色體臨近、基因融合、系統進化譜和基於晶片數據的基因共表達等等。我們來看看他們的光房網頁:

超過5000多個物種,2千多萬個蛋白,20億個蛋白互作,資料庫可謂及其龐大。光「大」還不夠,我們再來看看資料庫的品質,STRING資料庫僅僅在牛刊(NAR,Nucleic Acids Research)上就發表了7次(累計影響因子80分):

所以說,STRING資料庫可謂是「數據全,品質高」,那麼怎麼來使用這個資料庫呢?點擊STRING的官方網址進入之後,點擊中間大大的「Search」就可以了。如下圖:

然後就會轉跳到讓我們輸入基因列表的頁面,如下圖所示,我們點擊「Multiple proteins」,再依次輸入我們的基因列表和物種名稱即可。

然後網頁會自己搜索我們提交的蛋白,我們只要點擊continue即可,這個頁面我就不展示了,continue之後,就會出現這些基因的互作網路圖啦。整個操作還是非常簡單的哦。結果頁面如下圖所示,上面是一個總的網路圖。
我們在很多數據挖掘的文章中可以看到這個樣子的圖。這個網路圖當中有很多彩色的點,這個顏色是隨機分配沒有意義的,有的點當中還有花花綠綠的蛋白質三維結構,這個對我們來說也不是非常重要,重要的是蛋白之間的連線,也就是相互作用。那麼怎麼輸出這個圖呢?

這個結果頁面的下面有很多的panel,這裡面蘊含了非常多的功能,其中最主要的就是Export輸出,從這裡面可以輸出我們想要的圖形和網路。那我們應該保存哪個文件呢?下圖幫大家標註出來了,既可以直接輸出網路圖,也可以輸出網路圖的文本源文件,到底哪個更好呢?
對於初級分析來說,網路圖就行了,但是實話實說,這個圖稍微有點丑;如果需要高級的分析和美觀的網路圖,比如我們的研究課題中提及的,需要找到關鍵基因,需要發表品質的高級網路圖,那麼就需要源文件了。源文件是一個tsv文件,通過它,我們可以製作各種各樣的網路圖。

到這裡,我們的研究課題的三大步:
1、從基因列表到蛋白互作;(已完成)
2、從蛋白互作到互作網路;
3、從互作網路到關鍵基因;
超詳細操作影片
已經順利完成第一步了,下節教程我們講解第二步驟,如何從蛋白互作的網路文件到發表品質的網路圖。
本期乾貨
·
蛋白互作網路影片教程
及學習資料
原文詳情:「科研貓」公眾號
以上內容均為「科研貓」公眾號原創,嚴禁未經許可擅自轉載及資源分享,如需轉載,請申請獲得許可。