單細胞轉錄組逐漸淪為科研標配技術
- 2020 年 3 月 30 日
- 筆記
前面我們在單細胞天地系統性的總結了如果你的課題設計是一個或者兩個,三個甚至多個單細胞轉錄組樣本,該如何分析輔助你的課題的生物學故事,實際上單細胞並不一定要是故事的主角,在單細胞數據該怎麼利用?我們也提到了更深層次的數據分析展現技巧! 最近安排團隊學習者幫忙系統性整理單細胞腫瘤研究的3大應用方向的文獻,發現裡面包含一個數據集,從另外一個維度給我們展現了它的價值!
單細胞數據在GSE108679,大家可以下載去玩一玩,其數據分析的全部描述如下:
其實數據分析就是我們單細胞天地發布的全網第一個單細胞轉錄組課程所精鍊了常規單細胞轉錄組數據分析主線,就是5大R包, scater,monocle,Seurat,scran,M3Drop,然後10個步驟:
- step1: 創建對象
- step2: 品質控制
- step3: 表達量的標準化和歸一化
- step4: 去除干擾因素(多個樣本整合)
- step5: 判斷重要的基因
- step6: 多種降維演算法
- step7: 可視化降維結果
- step8: 多種聚類演算法
- step9: 聚類後找每個細胞亞群的標誌基因進行亞群命名
- step10: 繼續分類
現在讓我們來一一查看其中的主線圖表:
降維聚類分群可視化
因為是CELL文章,所以圖表會比較精鍊,如下:
展示感興趣基因的表達量
前面步驟分群後,很容易找到各個細胞亞群的標記基因,然後可視化如下:
細胞亞群功能注釋
通常這一步,就是對每個細胞亞群的重要的基因進行GO/KEGG資料庫注釋,跟bulk轉錄組分析方法類似。
細胞亞群的穩定性
這個通常是診斷性圖表,放在文章附件即可
不同細胞亞群有各自的標記基因
差異分析
這裡作者感興趣的是tSCs這一群細胞,跟所有其它細胞進行比較,差異分析進行熱圖展示:
作者的表達矩陣都公布了
在 https://www.ncbi.nlm.nih.gov/geo/query/acc.cgi?acc=GSE108679 可以公開免費下載,然後走我們教給大家的10個步驟就可以完成文章大部分圖表啦》
GSE108679_Phoenix_CSC_TPM.txt.gz 6.2 Mb (ftp)(http) TXT GSE108679_Phoenix_OT1_TPM.txt.gz 9.7 Mb (ftp)(http) TXT