IBD血緣同源簡介

  • 2019 年 12 月 19 日
  • 筆記

遺傳學中描述等位基因的同源關係時,會有IBD和IBS兩個概念。IBD全稱Identity By Descent, 又叫做血緣同源,指的是兩個個體中共有的等位基因來源於共同祖先;IBS全稱Identity By State, 又叫做狀態同源,指的是兩個個體中共有的等位基因序列相同。

為了定量描述兩個個體間的同源關係,對於IBS和IBD, 提出了IBS/IBD state的概念,以IBS為例,示意如下

對於某個等位基因,IBS state只要求allel的個數相同即可,而IBD state則進一步要求相同的allel來自於共同祖先。如下圖所示

3號和4號樣本只有1個allel相同, IBS state的值為1,而IBD state的值為0, 因為3號樣本的allel來自於父親,4號樣本的allel來自於母親,不是共同祖先。

利用IBD可以描述兩個樣本間的親緣關係,採用plink計算IBD的代碼如下

plink   --noweb   --file test   --genome   --allow-no-sex   --out ibd

輸出結果如下所示

每一列的含義如下

理想狀態下父子關係的兩個樣本,Z0, Z1, Z2對應的值分別為0,1, 0,所有位點的一個allel都繼承自父本;同卵雙胞胎的兩個樣本,則為0,0,1,所有的allel都來自共同的祖先,對於異卵雙胞胎,則為0.25,0.5,0.25,示意如下

上圖表示一個父親為AB,母親為CD的兩個雙胞胎的所有分型結果的可能,對應IBD三種取值的可能為0.25,0.5,0.25。

PI_HAT這個統計量的取值範圍為0-1,數值越大,兩個樣本的親緣關係越近,當為1時,表示的就是同卵雙胞胎,或者重複樣本,可以根據這個值篩選親緣關係近的樣本進行過濾。