你值得擁有的單細胞RNA測序分析工具TOP 3

  • 2020 年 3 月 27 日
  • 筆記

不知不覺在單細胞轉錄組領域做知識分析也快兩年了,很幸運聚集了五個小夥伴攜手共進,我們承諾不間斷更新5個月,把我們這兩年的學習成果全部掏出來給大家,包括5個欄目:
  1. 文獻速遞(簡短介紹,擴充知識面)
  2. 文獻詳解(圖文並茂帶來大家系統性學習)
  3. R與Bioconductor的技巧(書籍翻譯,妙招共享)
  4. scRNAseq的GitHub的書籍翻譯(原汁原味的名校教程)
  5. 全網第一個單細胞轉錄組影片教程學習筆記分享

希望大家能有所收穫!

你現在看到的是隨機欄目(澳大利亞在讀博士投稿)


前言

RNA測序相信大家已經接觸到不少了,它的樣品通常來自研究某一組織細胞群。這些細胞被認為是同質的,也就是說每一個細胞內的表達水平被認為是相似的。但事實上細胞之間的異質性是很普遍的,RNA測序最終將表達量值算作所有細胞表達量的平均值,其實是掩蓋了細胞間差異的訊號。而單細胞RNA測序(scRNAseq)就可以去發現細胞亞群中不同基因型和表型,或者不同的功能細胞之間的異質性。

單細胞RNA測序主要在免疫學、癌症和發育研究中使用。這個技術可以讓我們更全面的了解組織學上相似的細胞如何分化、發現新的細胞類型和狀態。而且在個性化醫療癌細胞靶點鑒定中有很好的應用前景。

單細胞RNA測序現在是一個非常熱門的技術,有著廣泛的應用。當然為這個新技術開發得生物資訊學工具也越來越多。OMICtools已經為我們選出了目前最受歡迎的單細胞RNA測序數據分析工具。(值得一提的是,OMICtools是一個非常有用的了解組學分析使用軟體的網站,有針對基因組、群體遺傳、RNAseq等各種分析的介紹。)

近日,OMICtools針對單細胞轉錄組數據處理工具進行了一場投票,讓我們一起來瞧瞧最受歡迎的3個工具吧!

第一

Seurat和Monocle並列第一,47%的人投給了它們

Seurat是一個可以做單細胞RNA測序數據品質控制、數據分析和數據挖掘的R包。演算法包括非監督聚類和預測細胞類型、單細胞數據空間重建以及不同處理,技術和跨物種的整合分析,還可以鑒定稀有細胞亞型。Seurat最有用的一點就是整合數據分析,它可以利用來自不同測序技術、不同物種和不同處理的數據中共同的變異來進行下游的差異分析。

Monocle是另一個比較成熟的軟體包,它提出了一個在擬時間(pseudotime)上對單細胞進行排序的策略,利用生物過程中單個細胞之間並不同步的表達狀態來還原這個生物過程的細胞軌跡。(這裡簡單的解釋一下,當我們進行細胞某一時序過程,例如細胞分化過程中的表達量變化時,單細胞RNA測序無法獲得單個細胞每個時間點的RNA。而這些生物學過程是一個動態的過程,表達量受到細胞相互作用和分子調控多種因素影響,在同一時間不同的細胞可能處於過程的不同階段,我們可以通過一些統計學手段還原整個過程的細胞時間軌跡,也就引入了pseudotime,擬時間)

Monocle運用高階的機器學習技術(Reversed Graph Embedding)來準確的對生物過程中的細胞進行排序。Monocle也可以利於t-SNE等降維的方法來進行聚類,然後發現差異表達基因。

第二

TSCAN和RCA同時獲得了43%的投票

TSCAN也是一款基於細胞轉錄組漸變進行擬時間(pseudo-temporal)排序的工具。TSCAN利用基於聚類的最小生成樹(minimum spanning tree,MST)演算法來排序,首先對細胞進行聚類然後利用MST演算法來連接每個亞群的中心。然後將每個細胞對應到樹上,排序後的過程軌跡就可以用來研究基因表達的動態變化。在構建最小生成樹之前先進行聚類減少數的空間複雜度,能夠更好的進行細胞排序。TSCAN還有圖形介面版本,支援數據可視化和用戶交互。你可以從Bioconductor中獲得,也可以使用Web版(https://zhiji.shinyapps.io/TSCAN/ )。

RCA(Reference Component Analysis)參考成分分析,這個演算法作為一個R 包用於對單細胞RNA測序數據進行聚類。RCA是目前已知的最好的單細胞轉錄組聚類方法,它所得到的聚類結果十分緊密,每個細胞簇幾乎完全有同一類型細胞組成。RCA還發現了直腸癌腫瘤魚正常粘膜中的多種細胞類型,要知道臨床樣品通常有非常強的批次效應。

RCA能對人類的單細胞RNA測序樣品進行聚類分析,包括三種模式:1.GlobalPanel: 全局模式,默認選項用於分析各類細胞;2. ColonEpitheliumPanel: 適合分析人類腸道樣品;3. SelfProjection:適用於分析不太明確的組織樣品,這個模式還在繼續優化中。

第三

Wishbone (python3)

Wishbone利用分叉樹(bifurcating branches)來識別單細胞的發育軌跡,首先支出分叉點,然後根據細胞的發育進度將每個細胞標記為分叉前(pre-bifurcation)或者兩個不同細胞命運里的其中一個分叉後(post-bifurcation)的支上,從而完成排序。這個方法還被應用在研究小鼠骨髓細胞分化上。Wishbone可以分析各種測序技術得到的單細胞RNA測序數據,如單細胞質譜流式(Mass Ctyometry)和單細胞RNA測序。

最後

相關軟體鏈接

Seurat

https://cran.r-project.org/web/packages/Seurat/index.html

Monocle

https://bioconductor.org/packages/release/bioc/html/monocle.html

TSCAN

http://bioconductor.org/packages/release/bioc/html/TSCAN.html

Web在線分析:https://zhiji.shinyapps.io/TSCAN/

Youtube Demo 演示:https://www.youtube.com/watch?v=zdcBAVe1GBE

RCA

https://github.com/GIS-SP-Group/RCA

Wishbone

https://github.com/ManuSetty/wishbone