乾濕結合發6.68分,這樣的套路給我來一打

  • 2020 年 2 月 19 日
  • 筆記

目前,純生信分析發文依然是如火如荼,但隨著審稿人的審美疲勞,其口味也越來越挑。純生信文章不再那麼容易滿足審稿人的味蕾了,所以,「生信分析+實驗驗證」也是目前生信類高分文章的整體套路。到底怎樣將生信分析與實驗驗證完美的整合呢?今天,一起學習一篇6.68分的文章,看看 「別人家的套路吧」!

文章的題目是:Identification of AUNIP as a candidate diagnostic and prognostic biomarker for oral squamous cell carcinoma.

下面,和大家一起分解作者的套路:

一、研究材料

1

臨床樣本

包含89個口腔鱗狀細胞癌(OSCC)樣本和16個正常對照樣本(癌旁組織) 組織微陣列晶片。另外是4對OSCC和相匹配的正常口腔組織樣本。這些臨床樣本均含有臨床病理特徵的數據。

2

生信數據

從GEO資料庫(http://www.ncbi.nlm.nih.gov/geo/)中選擇了GSE30784,GSE3524,GSE78060,GSE41613四張晶片,然後下載原始文件(.CEL文件)和平台文件(GPL文件)。使用R/Bioconductor中的「affy包」和「impute包」對每個GEO數據集的矩陣數據進行背景校正,歸一化,log2轉換和缺失值補充。GEO數據就處理完了。通過TCGA資料庫(https://www.cancer.gov)和FireBrowse資料庫(http://www.firebrowse.org)中下載與OSCC相關的相關文件(.count文件)和臨床資訊。

二、上調差異表達基因(DEG)的篩選

以log2FoldChange(FC)>1且adjusted P-value<0.01作為上調差異基因的篩選標準,篩選GSE30784, GSE3524,and GSE78060三張晶片中上調的差異基因,然後求三張晶片的交集,最終篩選出來了90個重疊的上調的DEG,再利用TCGA資料庫對這90個上調的DEG進行驗證,結果是一致的。

上調的DEG交集的韋恩圖:

TCGA資料庫驗證的熱圖:左邊是正常組織,右邊是腫瘤組織。

三、鑒定診斷OSCC的關鍵基因

通過ROC曲線分析,並比較AUC值,以評估上述90個候選基因在TCGA資料庫中診斷OSCC的敏感性和特異性。根據其AUC值(<0.940)列出了TOP10基因,表明這些基因對OSCC的診斷意義最高。為了驗證這10個基因對OSCC的診斷意義,再次在GSE30784數據集中進行了ROC曲線分析。

AUNIP在癌症中的表達和功能不明確,因此,作者提出了AUNIP作為本研究的目標基因。確定了目標基因後,建立Logistic回歸模型,以進一步評估AUNIP在診斷OSCC中的有效性。通過構建五倍交叉驗證的AUNIP的ROC曲線和混淆矩陣,結果明確了AUNIP在OSCC樣本中的診斷價值。

四、AUNIP的高表達與OSCC的進展和

腫瘤純度的分析

利用TCGA數據,首先是正常樣本與腫瘤樣本的差異比較(a);其次分析了AUNIP的不同表達水平與OSCC患者臨床病理特徵之間的相關性,HPV感染、基質評分、免疫評分、組織學分級、腫瘤T分期這五個特徵均得出了有統計意義的差異。

通過分析,AUNIP的表達與ESTIMATE得分(使用TCGA樣本的表達數據估計惡性腫瘤組織中的基質細胞和免疫細胞的值)呈負相關,表明AUNIP與OSCC的腫瘤純度呈正相關。

最後,再通過Western blotting和IHC染色檢測AUNIP的蛋白表達,其結果與OSCC組織中的mRNA表達一致。Western顯示了OSCC患者中AUNIP過表達(圖a)。在IHC染色中,與正常對照(圖b-c)和成對的相鄰正常口腔組織(圖d)相比,OSCC組織中的AUNIP過表達。通過IHC染色的ROC曲線分析獲得的AUC值為0.725,且具有統計學意義,支援AUNIP對OSCC的診斷價值(圖f),並且AUNIP蛋白表達隨著惡性腫瘤的進展而增長(通過組織學等級的改變來反映:圖c;圖e)。以上實驗得出了AUNIP在OSCC中的潛在致癌作用的結論。

五、WGCNA網路構建和關鍵模組的識別

還記得之前剩下的一個GEO晶片GSE41613嗎?GSE41613數據集包括97名OSCC患者,並提供詳細的總體生存資訊,適合於WGCNA的構建。所以可以將模組特徵基因與OSCC患者的生存數據聯繫起來。通過WGCNA,發現黃色模組與OSCC患者的生存時間最相關,而AUNIP是MM>>0條件下的基因之一,因此,AUNIP被認為是黃色模組中的中樞基因之一。

六、基因功能注釋和GSEA

為了進一步探索AUNIP在OSCC中的潛在生物學功能,作者基於WGCNA中的拓撲重疊構建了與AUNIP正相關的134個基因的網路(圖b),發現這些基因在306個來自TCGA資料庫的OSCC樣本中的表達譜數據相似(圖c)。

對這些基因進行GO和KEGG的分析。

AUNIP在OSCC中的GSEA分析。

鑒於關鍵分子在OSCC的細胞周期調控,DNA修復和HPV感染中起著至關重要的作用。通過相關分析來評估TCGA資料庫的OSCC樣本中的AUNIP與幾個基因之間的關係。最終推斷AUNIP可以調節有絲分裂細胞周期的進程,與OSCC中的HPV感染有關,並在腫瘤發生過程中起重要作用。

七、細胞實驗驗證

為了驗證上述生物資訊學分析的結果,在SCC-9和SCC-15兩株OSCC細胞系中將AUNIP敲減(圖a,b)。AUNIP完全敲出後,OSCC細胞中的集落形成顯著減少(圖 c)。

流式細胞儀分析細胞周期,如圖d。觀察到AUNIP敲減後的OSCC細胞停滯在G0/G1期,證實了AUNIP在控制細胞周期進程中的重要作用。

八、AUNIP的高表達與OSCC的預後的關係

AUNIP具有潛在的致癌能力,值得探討AUNIP在OSCC中的預後價值。GSE41613和TCGA數據中,將AUNIPmRNA表達與臨床預後數據結合,進行Kaplan-Meier生存分析和Log-Rank檢驗,均發現AUNIP的高表達與OSCC的預後不良相關。

最後,分別進行單因素和多因素分析。單因素分析發現具有統計學意義的7個指標是AUNIP表達,放療,淋巴管浸潤,神經侵犯,腫瘤分期,腫瘤T期和腫瘤N期。多因素分析表明,AUNIP可被視為OSCC的獨立預後的指標。

套路總結

1、TCGA和GEO數據的下載和上調的差異基因的篩選,及兩個資料庫相互驗證;

2、通過ROC曲線分析及AUC的比較,鑒定出診斷OSCC的關鍵基因,確定候選的目標基因;

3、目標基因的表達與腫瘤純度和腫瘤進展的生信分析,WB和免疫組化檢查蛋白表達與基因表達的一致性;

4、WGCNA識別關鍵模組及鑒定中樞基因;

5、與目標基因相關的基因的功能注釋(GO/KEGG)和目標基因的GSEA;

6、細胞實驗驗證:主要是針對目標基因功能的驗證,包括基因敲減和流式檢測。

7、預後的分析:生存曲線繪製、單因素和多因素分析。

8、得出實驗結論:腫瘤診斷及預後的標記物。

生信分析還是常規的生信分析,實驗也是常規的實驗,當它們結合時候,必然會擦出高分SCI的火花,難道這不是套路嗎?關注百味科研芝士,一起學習科研套路!如需生信分析服務也可以與小編聯繫哦。原文獲取方式,後台回復關鍵詞:20200214