生信分析也能零程式碼發3分的SCI

  • 2019 年 10 月 7 日
  • 筆記

經常有小夥伴跟我抱怨,沒時間沒精力去學程式碼,太複雜了。當然也有些小夥伴確實打起精神開始學,從網上搜了一大堆R語言資料,和生物資訊學資料,甚至還買了本R語言實戰的書,甚至還學起了python,準備大幹一場。但是,有時候實在是心有餘而力不足,一邊要學實驗技術,上課,讀文獻,甚至要在臨床輪轉,當初高漲的熱情很快就被磨滅,然後就沒有然後了。

如果實在沒時間精力程式碼,咱們還有好用的資料庫呀,如果運用得當,又有好的想法,一樣能做些工作,這裡白介素同學分享一篇文獻,全文沒有使用任何一句程式碼,但是人家發了3分的文章哦。來來來,解析下這篇文章是怎麼操作的吧,首先看看摘要內容:

看到方法學部分了吧, 人家就用了4個網路資料庫,說明一下,全是在線的點擊版本,非常簡單好用。做的工作其實也很簡單,就是講了看了AQP這個基因family在乳腺癌中的表達情況,與預後關係等。

下面看下具體是做了哪些內容嘞?咱們看圖說話:

這張圖很熟悉呀,就是Oncomine資料庫做的,操作一下,特別說明這個資料庫本身需要edu的郵箱註冊,用起來很方便,是最大的腫瘤晶片資料庫。這裡作者是看下這些目標基因在各種腫瘤裡邊的表達情況,以熱圖的形式展現出來。

然後放了張表格,其實也不是關鍵數據,也是Oncomine的數據。

接下來又是張表格,分析了下各個基因的mRNA表達水平與臨床病理特徵的相關性。這個是在bc-GenExMiner v4.1這個資料庫做的。

然後是這些基因在不同分級中的表達情況:(這裡指出下作者沒說清楚用啥做的,確定的是還是用以上這些資料庫的數據)

然後就是做生存分析了,看下這些基因與預後的關係,用的資料庫是KMplot,這個大家應該比較熟悉了,非常好用的資料庫,作的圖可直接用於發表。

再接下來,還是一個這樣的生存分析,展示的是這些基因在不同亞型中與預後的關係,也是用這個資料庫操作的,很簡單,看起來數據很多,其實不然。

再接下來,換了個資料庫,該分析的都分析得差不多了,用cBioportal資料庫分析基因突變與生存的關係,還有這些基因在乳腺癌中的突變情況,那個圖也很簡單:關於該資料庫的使用我們做了一期非常細緻的帖子:懶人如何分析TCGA數據之cBioportal網站

全文的分析內容到這裡就結束了,後面必然還需要大段的討論分析的,這個你懂的。就這樣一個3分的文章研究內容就結束了。這篇文章能得到哪些結論呢? 頂多就是這些基因在腫瘤中的表達情況,預後情況,還有就是突變情況這三個層次了。

如果熟悉這些資料庫,完成這些操作3天的時間肯定是足夠了。

好了,白介素同學只能幫到這裡了。 熟練使用資料庫去呀,資料庫就在那裡,怎樣使用,會不會使用全看自己了。