IBD血缘同源简介

  • 2019 年 12 月 19 日
  • 筆記

遗传学中描述等位基因的同源关系时,会有IBD和IBS两个概念。IBD全称Identity By Descent, 又叫做血缘同源,指的是两个个体中共有的等位基因来源于共同祖先;IBS全称Identity By State, 又叫做状态同源,指的是两个个体中共有的等位基因序列相同。

为了定量描述两个个体间的同源关系,对于IBS和IBD, 提出了IBS/IBD state的概念,以IBS为例,示意如下

对于某个等位基因,IBS state只要求allel的个数相同即可,而IBD state则进一步要求相同的allel来自于共同祖先。如下图所示

3号和4号样本只有1个allel相同, IBS state的值为1,而IBD state的值为0, 因为3号样本的allel来自于父亲,4号样本的allel来自于母亲,不是共同祖先。

利用IBD可以描述两个样本间的亲缘关系,采用plink计算IBD的代码如下

plink   --noweb   --file test   --genome   --allow-no-sex   --out ibd

输出结果如下所示

每一列的含义如下

理想状态下父子关系的两个样本,Z0, Z1, Z2对应的值分别为0,1, 0,所有位点的一个allel都继承自父本;同卵双胞胎的两个样本,则为0,0,1,所有的allel都来自共同的祖先,对于异卵双胞胎,则为0.25,0.5,0.25,示意如下

上图表示一个父亲为AB,母亲为CD的两个双胞胎的所有分型结果的可能,对应IBD三种取值的可能为0.25,0.5,0.25。

PI_HAT这个统计量的取值范围为0-1,数值越大,两个样本的亲缘关系越近,当为1时,表示的就是同卵双胞胎,或者重复样本,可以根据这个值筛选亲缘关系近的样本进行过滤。