TCGA資料庫篩選出有生存意義的lncRNA
- 2020 年 4 月 9 日
- 筆記
長鏈非編碼RNA(Long non-coding RNA), lncRNA是一類本身不編碼蛋白、轉錄本長度超過200nt的長鏈非編碼RNA分子,它可在多層面上(表觀遺傳調控、轉錄調控以及轉錄後調控等)調控基因的表達。lncRNA最初被認為是RNA聚合酶II轉錄的副產物,是一種「噪音」,不具有生物學功能。然而,今年來的研究表面,lncRNA參與了X染色體沉默、染色體修飾和基因組修飾、轉錄激活、轉錄干擾、核內運輸等過程,其調控作用正在被越來越多的人研究。
據統計,哺乳動物蛋白編碼基因佔總RNA的1%,長鏈非編碼RNA佔總RNA的比例可達4%-9%,這些長鏈非編碼RNA是基因功能研究的又一座寶庫。目前發現的許多lncRNA都具有保守的二級結構,一定的剪切形式以及亞細胞定位。它們在基因組上相對於蛋白編碼基因的位置,可以分為5種:正義鏈(sense)、反義鏈(antisense)、雙向(bidirectional)、內含子間(intronic)、基因間(intergenic),其所在的位置與其功能有一定的相關性。
lncRNA的作用機制 長鏈非編碼RNA的作用機制非常複雜,至今尚未完全清楚。根據目前的研究,lncRNA的作用機制如要有以下幾種(如圖)。

- 編碼蛋白的基因上游啟動子區(橙色)轉錄,干擾下游基因(藍色)的表達;
- 抑制RNA聚合酶II或者介導染色質重構以及組蛋白修飾,影響下游基因(藍色)的表達;
- 與編碼蛋白基因的轉錄本形成互補雙鏈(紫色),干擾mRNA的剪切,形成不同的剪切形式;
- 與編碼蛋白基因的轉錄本形成互補雙鏈(紫色),在Dicer酶的作用下產生內源性siRNA;
- 與特定蛋白質結合,lncRNA轉錄本(綠色)可調節相應蛋白的活性;
- 作為結構組分與蛋白質形成核酸蛋白質複合體;
- 結合到特定蛋白質上,改變該蛋白質的細胞定位;
- 作為小分子RNA(如miRNA、piRNA)的前體分子。
主要寫如何快速的篩選出有生存意義的lncRNA
一般來說lncRNA有一萬多個,如何快速的篩選出所有P小於0.05(生存分析)。單因素生存分析,基於TCGA資料庫的基因表達矩陣。
- 注釋lncRNA
- 合併臨床數據(生存數據)
- 快速的篩選分析