因果推断学习3 — 随机试验
- 2021 年 2 月 20 日
- AI
本篇讲解如何探测因果性,并计算因果效应
Potential outcomes
之前我们讲因果推断就是推测某个试验(treatment)针对某个结果(outcome)的效应(effect)。为了定量计算,我们需要定义一些数量。以起床头疼举例子,那么起床是否头疼就是结果 ,我们的研究对象为试验T(比如是否吃药)
当吃药不头疼了,不吃药头还疼,那我们可能会认为吃药和解决头疼存在因果效应

当吃不吃药头都疼,则我们会认为吃药和解决头疼不存在因果效应

所以我们可以由此引出因果效应计算方法。记do(T=1)为施加试验(吃药),do(T=0)为不施加试验(不吃药);Y表达结果(是否头疼)。则潜在结果就是do(T=1)的结果Y和do(T=0)的结果Y,记为

因此,因果效应可以计算为 ,代表施加与不施加试验结果的差异。简记为
,这是针对某个人i的因果效应,称为ITE (Individual treatment effect)
Fundamental Problem of causal inference
针对某个人,你对其施加treatment(比如吃药),则你就无法观察到不施加treatment的结果。你只能得到potential outcomes中一个结果,另一个称为反事实(Counterfactual)。因为无法观测到counterfactual,所以无法计算ITE
因此,我们希望能计算针对人群的平均效应ATE (Average treatment effect)
上式是一个因果效应的计算,使用了期望的线性性质。但为了统计计算方便我们希望计算针对试验的条件期望,但这往往是不相等的。
这是因为等号右边衡量的是相关性(基于统计),上次讲解了由于存在confounding association,相关性无法推出因果性(等号左边)(回忆:相关性中包含causal association与confounding association)
随机试验 (RCTs)
根据以上分析,当存在confounding时,我们无法通过条件期望计算因果效应(ATE) 。假如不存在confounding(不存在confounding association),则可以计算因果效应。一种方案是没有额外因素来影响试验 T,也就是随机试验(treatment T 完全随机决定),

随机试验特点如下
- 试验完全由随机决定 (T无causal parents)
- 此时treatment组和control组是可比的,因为其他因素在两个组分布均匀
- 此时可以通过条件期望计算因果效应
- 存在其他未观测confounding时,只要进行随机试验,就可以计算因果效应
no confounding:
Observational studies
以上我们说明了,随机试验是计算因果效应的一种完美的方法。但现实生活中大量的数据,它们不是随机试验得到的,这些数据的生产来源大多也不是为了计算因果效应。我们如何从这些数据中推断因果,具有更大的意义。
虽然随机试验是计算因果效应的理想方案,但在现实世界中,随机试验可能由于种种原因是无法进行的,观测研究(Observational studies)就更加有价值了!
- Ethical reasons:比如试验为吸烟,随机让人吸烟违反伦理
- Infeasibility:目标为分析不同社会性质(社会主义、资本主义)对经济的效应,无法随机分配人的社会属性
- Impossibility:研究DNA某些片段对癌症的效应(无法随机修改DNA)

因此,观测研究是十分必要的,但是观测研究中往往包含Confounding association,混淆了变量之间的相关性,那我们如何研究因果效应呢?
Solutions: adjust/control for confounders
因果推断的观测研究的直接问题就是存在confounders C,我们对其进行处理分析,进而进行因果推断。
- C is sufficient adjustment set
当confounder是sufficient adjustment set时,我们根据上式可以发现,基于confounder作为条件时,计算等式最终是不包含因果变量的(统计量E[Y|t,c]),方便我们计算因果效应。能这样做的原因是我们基于confounder作为条件时,我们阻断了C->Y的因果路径。(相当于取某个C值时,组里C都是一样,结果差异不由confounder导致)

由于计算结果是基于confounder C的条件的,我们还需要margin out C来计算T的因果效应
backdoor adjustment
当存在多个confounders时,类似的阻断那些sufficient adjustment set confounders。目的就是把casual association分离出来!

Note:观察可以发现,confounder都是T和Y的因,所以我们需要去控制调节(condition on)它。遇到如下V型结构,我们不需要去控制它,细节以后再说。

例子
之前那个COVID-27例子,基于上述方法计算可得,在这个因果结构(存在confounder)下,Treatment B更好。

可以发现,我们之前提到的Simpson’s Paradox存在就是因为计算过程中Treatment和Control组中不同的严重程度(confounder)分配权重是不同的,所以导致两个组内confounder因素存在差异,导致不可比。根据上式计算可以发现,实验组和对照组中confounder的权重都是一样的,所以计算是合理的!