深度分析:生信+免疫+COX模型,突破5分不在話下
- 2019 年 12 月 17 日
- 筆記
今天分享的是今年9月發表在Aging(IF=5.5)上的一篇文章,研究透明細胞腎細胞癌微環境中新型標誌物的預後價值和免疫浸潤情況。文章主題仍是生信分析結合免疫,但內容是以生信分析做基礎,挑選出樞紐基因後結合臨床病理特徵進行多因素COX回歸分析,構建了回歸模型,最後進行樞紐基因免疫浸潤的分析。

這是文章的總體思路,下面我們按照具體步驟拆解一下文章套路。
一
免疫相關評分與臨床病理特徵、預後間的關係
免疫相關評分主要包括三個方面,即immune score 免疫細胞打分, stromal score 基質細胞打分, estimate score 綜合打分。作者首先分析了癌症分級、分期與ESTIMATE評分之間的聯繫,顯示兩者間存在關聯,且腫瘤的最快進展(G4、Ⅳ期)表現為最高的ESTIMATE評分(圖1 A B)。接下來按評分分為高低兩組分別進行預後分析,三種評分中均顯示低評分組預後較好(圖1 C D E)。

圖 1
二
差異表達基因的篩選
這一步是基於免疫評分和基質評分篩選差異表達基因,首先從TCGA數據庫中下載原始數據,基於免疫評分篩選出162個高表達基因和747個低表達基因,基於基質評分篩選出261個高表達基因和1198個低表達基因。最後通過取交集確定77個高表達基因和787個低表達基因作為最終的差異表達基因(圖2 C D)。隨後,作者用共計864個差異表達基因進行了功能富集分析(圖2 E),又對77個高表達基因進行聚類並繪製了熱圖(圖 2 F)。

圖2
三
PPI(蛋白-蛋白互作網絡)構建
作者基於上述過程中篩選出的77個上調差異表達基因構建了PPI網絡,並對這些基因進行了功能富集分析(圖3B),隨後運用模塊化分析篩選出四個重要模塊,其中最顯著的模塊包含6個基因AGPAT9, AQP7, HMGCS2, KLF15, MLXIPL, PPARGC1A,這些基因被認為是樞紐基因(圖3A)。

圖 3
四
樞紐基因的表達量、預後和COX回歸分析
隨後,基於TCGA數據庫中基因表達量數據和臨床信息數據,作者進行了樞紐基因的表達量、預後和COX回歸分析。表達量和預後分析顯示AGPAT9, AQP7, HMGCS2, KLF15, PPARGC1A在腫瘤中低表達且其低表達預示不良預後,MLXIPL在腫瘤中高表達且其高表達也預示不良預後(圖 4)。經過單因素和多因素COX分析,最終腫瘤有遠處轉移(pM stage)、較高的分級(ISUP grade)、MLXIPL高表達是預後的危險因素,PPARGC1A高表達為保護因素(圖 5)。

圖 4

圖 5
五
RT-qPCR驗證MLXIPL和PPARGC1A的表達量和預後情況
隨後,作者在自己的380對配對樣本驗證了MLXIPL和PPARGC1A的表達量和預後情況,結果顯示MLXIPL在腫瘤中高表達且其高表達在無進展生存期和總生存期中均預示着不良預後,PPARGC1A在腫瘤中低表達且其低表達在無進展生存期和總生存期中均預示着不良預後(圖 6)。

圖 6
六
多因素COX回歸分析構建模型和ROC曲線分析
接下來利用上述380對配對樣本的相關信息,通過多因素COX回歸分析構建預測模型,共有6個參數進入方程。針對MLXIPL和PPARGC1A分別構建了無進展生存期(PFS)和總生存期(OS)的模型。

上述方程每一項前面數字就是多因素分析中的HR值,後面則是進入該方程的臨床病理學參數(圖 7)。
後面接着進行了ROC曲線分析以驗證方程的效能,作者首先在自己的樣本中進行驗證,後續又用外部數據集TCGA中數據進行驗證,兩次驗證AUC曲線下面積均大於0.7,證明文中構建的模型分類效能較好(圖 8)。

圖 7

圖 8
七
MLXIPL和PPARGC1A的免疫浸潤分析
通過TIMER網站進行MLXIPL和PPARGC1A的免疫細胞浸潤相關分析,結果顯示MLXIPL和PPARGC1A的表達和腫瘤純度相關,MLXIPL和PPARGC1A表達升高與B細胞、CD8+ T細胞、巨噬細胞、中性白細胞和樹突狀細胞浸潤關係密切,並使免疫浸潤水平普遍下降(圖 9)。後續利用GEPIA網站可以進行更為細緻的相關性分析。

圖 9

至此這篇文章的分析就結束了,分析的前三步就是常規的生信加免疫套路,先分析免疫相關評分與臨床病理特徵間的聯繫,隨後篩選差異表達基因,進行功能富集並構建PPI網絡。
其實僅僅這三步的分析也可以組合成一篇稍微低階的SCI文章了,從第四步開始篩選出樞紐基因進行預後分析、COX分析、構建模型、繪製ROC曲線、免疫浸潤相關性分析才是這篇文章層次上升的重點,也是我們可以借鑒的地方。例如前期只做了基礎的生信分析篩出來樞紐基因,後續可以從第四步繼續分析以增加分析的深度。當然,如果暫時自己沒有足夠的樣本進行分析,也可以直接從現有數據庫下載數據,構建出模型後選取其他數據庫中信息進行外部驗證。
如果你有生信需求,也可以聯繫小編分析哦!