因果推断学习2 — 相关性!=因果性
- 2021 年 2 月 20 日
- AI
本文从 角度来说明因果推断的意义。
假设我们现在有一堆数据表明,大多数穿鞋睡觉的人,起床会头痛;大多数没有穿鞋睡觉的人们,起床不会头痛!穿鞋睡觉和起床头痛具有很高的相关性。

如果不想起床头痛,我晚上睡觉不穿鞋会有用吗?这就需要判断穿鞋睡觉是否是起床头痛的原因!
假设有额外数据显示,穿鞋睡觉的人大多数都喝多了,且第二天头痛的人大多数也是这些人。有可能说明,导致穿鞋睡觉和起床头痛的高相关性是因为他们有一个共同因素(common cause)就是:喝多了!

分析一下穿鞋睡觉和起床头痛有很高相关性的可能原因。
- 两组人群有很大的差异性,穿鞋睡觉的人基本都喝多了,而没穿鞋睡觉的人基本没喝多,所以这两组人群本身是不可比的,也就无法进行因果推断计算。只有除了研究因素外其他因素都无明显差异情况下,两组人群针对研究因素才可比。
- Confounding,先解释一下什么是confounding(混淆)。由存在共同原因(common cause),它混淆了两个变量的相关性。如下图所示,confounder会导致观测数据存在confounding association。而我们观测到的数据,存在这两种混合的相关性。而因果性也会导致一定的相关性,称为causal association,但是由于confounding association的存在,我们观测到的混合相关性无法直接推测出因果关系,所以相关性与因果性不同,也无法推出因果性!

——-认知偏差 (cognitive bias)
虽然大家都知道相关性等于因果性是错误的,但是大家潜意识都会默认来使用这一点,这是由大脑思维存在一些固定思维倾向导致的认知偏误。
可以把穿鞋睡觉换成任何事情,任何与起床头疼的可能存在相关的事情。

只是想找到一个解释,来避免下次产生头疼这件事。* 可以有如下来源

- availability heuristic:任何你想起最近的事情,比如喝了咖啡,你会认为喝了咖啡导致了我起床头疼。(甚至很久以前你看过文章说咖啡不会导致头疼。但那么久的事情已经忘了)
- motivated reasoning:一般由个人的价值观或世界观诱导。比如,一个人不喜欢和岳父相处,则他会把头疼这件事归因于与岳父相处,给你一个理由来拒绝不想做的事情。
下一节讲什么导致因果!