單細胞轉錄組的CNV可以區分細胞惡性與否
- 2020 年 3 月 30 日
- 筆記
對單細胞轉錄組數據計算基因組層面的CNV資訊,這個概念最早來自於Aviv Regev實驗室,在她的一系列文章裡面得到了淋漓盡致的展示。
Aviv Regev;早年在以色列的特拉維夫大學(Tel Aviv University)攻讀碩士學位,在其跨學科卓越項目(Interdisciplinary Program for the Fostering of Excellence)中學習生物學、電腦科學和數學,之後在特拉維夫大學取得計算生物學博士學位。女神作為一個計算與系統生物學家,目前就職於麻省理工學院,為生物學教授,同時也是霍華德休斯醫學研究所(Howard Hughes Medical Institute)的研究員、以及Broad Institute的卡曼細胞觀測與細胞迴路項目(the Klarman Cell Observatory and Cell Circuits Program)的領頭人、和國際人類細胞圖譜計劃(the international Human Cell Atlas project)的共同主席。
第一篇就是2014的science關於GBM的單細胞轉錄組文章,DOI: 10.1126/science.1254257 標題是; Single-cell RNA-seq highlights intratumoral heterogeneity in primary glioblastoma 而且當時把單細胞轉錄組的CNV演算法在CCLE的數據裡面驗證了,如下圖:
關於Aviv Regev實驗室在broad開發的工具,對單細胞轉錄組數據計算CNV及繪製熱圖,可以看我的早期教程了解背景知識:
- 單細胞轉錄組數據分析CNV
- 使用broad出品的inferCNV來對單細胞轉錄組數據推斷CNV資訊
- 使用inferCNV來推斷CCLE轉錄組數據的拷貝數變異
- 使用inferCNV來推斷2014的science關於GBM文章的單細胞轉錄組數據的拷貝數情況
我也拿那個軟體在普通的bulk轉錄組數據,CCLE資料庫數據,以及兩個單細胞數據集測試了,最後在2014的science關於GBM文章的數據裡面驗證了,可以說已經學會了該軟體的使用,但是只會用軟體成不了氣候,還是得深入理解原理。諸君也要加油哦。
2016年4月science雜誌的黑色素瘤
下載發表在Science. 2016 Apr,題目是: Dissecting the multicellular ecosystem of metastatic melanoma by single-cell RNA-seq. 文獻,找到單細胞轉錄組表達矩陣 GSE72056, 研究者選擇了 19個黑色素瘤病人,獲得了4645個單細胞,進行轉錄組測序。文件是 GSE72056_melanoma_single_cell_revised_v2.txt.gz,載入R裡面走scater流程即可。
如果要走inferCNV流程,可能需要看最新文檔了,如下,非常清晰的看到,惡性細胞是具有跟WES類似的CNV,但是非惡性細胞就沒有!
2017年12月CELL雜誌的頭頸癌
下載發表於2017年12月,在CELL雜誌:Single-Cell Transcriptomic Analysis of Primary and Metastatic Tumor Ecosystems in Head and Neck Cancer 的文獻,找到單細胞轉錄組表達矩陣,數據公布在 GSE103322 。研究者用Smart-seq2
建庫方法得到的單細胞轉錄組數據經過QC後,留下了來自18名患者的5,902個細胞,首先可以分成2215個惡性細胞和3363個非惡性細胞。文件是 GSE103322_HNSCC_all_data.txt.gz,有86.0 Mb,對進行3363個非惡性細胞表達矩陣分群,根據已知標記基因(自行搜索)的表達,注釋並且找到B細胞,巨噬細胞,樹突狀細胞,肥大細胞,內皮細胞,成纖維細胞和肌細胞這8類!
也是可以根據單細胞轉錄組的CNV資訊,很清晰的看到惡性細胞與非惡性細胞。
2017年NC的乳腺
下載發表在 Nat Commun. 2017 May 的文獻, 耗時一年才發表,算是乳腺癌領域非常早的單細胞轉錄組研究了,韓國人做的,題目是:Single-cell RNA-seq enables comprehensive tumour and immune cell profiling in primary breast cancer. 找到單細胞轉錄組表達矩陣 :GSE75688 下載表達矩陣和樣本資訊,從GSE75688_GEO_processed_Breast_Cancer_raw_TPM_matrix.txt.gz文件裡面僅僅是提取非tumor的細胞,使用SingleCellExperiment函數構建 SingleCellExperiment 對象後走scater的PCA並且可視化,看看錶型文件GSE75688_final_sample_information.txt.gz記錄的細胞類型是否區分的很開。
這裡我就不繼續截圖了,相信你可以看到更多的類似的文章。
不過,對10X的單細胞轉錄組數據,其實使用這樣的分析方法,是存疑的!