eQTL:連接突變與基因表達的橋樑
- 2019 年 12 月 19 日
- 筆記
在高等生物中,很多的重要性狀都為數量形狀,比如農作物的產量,人類複雜疾病(高血液,糖尿病)等等。對於這些數量性狀而言,往往受到多個基因的調控作用。為了更好的開展複雜性狀的遺傳學研究,挖掘調控複雜性狀的相關基因,QTL技術應運而生。
QTL全稱如下
quantitative trait lici
稱之為數量性狀基因定位,該技術的目的是定位控制數量性狀的主效基因在染色體上的位置。該技術首先利用合適的作圖群體和分子標記,構建高密度的遺傳連鎖圖譜,然後在遺傳圖譜上定位對應的主效基因。該方法依賴作圖群體,遺傳圖譜,分析方法等多種因素, 定位到的QTL區域往往包含許多候選基因,後續還需結合其他技術進一步進行精細定位。
eQTL全程如下
expression quantitative trait loci
稱之為表達定量性狀基因座位, 其概念建立在QTL的基礎上,只不過將表型換成了基因的表達量,定位基因組中控制mRNA表達水平的基因座, 採用的分子標記為SNP。利用基因分型和轉錄組分析結果,可以快速的進行eQTL分析。
eQTL可以分為以下兩類
- cis-eQTL, 也稱之為local eQTL,順式eQTL
- trans-eQTL, 也稱之為distant eQTL, 反式eQTL
示意圖如下

cis-eQTL指的是eQTL定位在調控基因自身所在區域,比如基因的啟動子區或者編碼區。當位於基因啟動子區時,可能引起轉錄因子結合位點的改變或者染色質結構的變化,從而影響基因表達;當位於基因編碼區時,會導致編碼蛋白髮生變化,從而影響自身基因的表達。
trans-eQTL指的是eQTL距離調控基因非常遠,大於20Mb以上,甚至不在同一條染色體上。反式eQTL可能的作用模式是通過諸如轉錄因子等調控蛋白來來介導靶標目的基因的表達,比如上圖所示的SNP X位點,位於GeneA的啟動子區,SNP X對基因A而言為cis-eQTL, SNP X通過調控基因A產生的轉錄因子, 從而影響轉錄因子A的靶標基因B, 對於基因B而言,SNP X為trans-eQTL。
和基因表達與調控類似,科學家發現eQTL是具有人群,組織,細胞特異性的,不同組織或者細胞中eQTL是不盡相同的。
通過NGS和晶片技術,可以快速得到大量樣本的基因分型和定量結果。基於以上兩種結果,可以開展eQTL研究。
eQTL的核心演算法是線性回歸,和GWAS中的線性回歸類似,只不過將基因表達量作為因變數。目前也有很多eQTL研究的工具和資料庫,後續會詳細介紹。