因果推斷學習2 — 相關性!=因果性

  • 2021 年 2 月 20 日
  • AI

本文從 相關性\ne 因果性角度來說明因果推斷的意義。

假設我們現在有一堆數據表明,大多數穿鞋睡覺的人,起床會頭痛;大多數沒有穿鞋睡覺的人們,起床不會頭痛!穿鞋睡覺和起床頭痛具有很高的相關性。

如果不想起床頭痛,我晚上睡覺不穿鞋會有用嗎?這就需要判斷穿鞋睡覺是否是起床頭痛的原因!

假設有額外數據顯示,穿鞋睡覺的人大多數都喝多了,且第二天頭痛的人大多數也是這些人。有可能說明,導致穿鞋睡覺和起床頭痛的高相關性是因為他們有一個共同因素(common cause)就是:喝多了!

分析一下穿鞋睡覺和起床頭痛有很高相關性的可能原因。

  1. 兩組人群有很大的差異性,穿鞋睡覺的人基本都喝多了,而沒穿鞋睡覺的人基本沒喝多,所以這兩組人群本身是不可比的,也就無法進行因果推斷計算。只有除了研究因素外其他因素都無明顯差異情況下,兩組人群針對研究因素才可比。
  2. Confounding,先解釋一下什麼是confounding(混淆)。由存在共同原因(common cause),它混淆了兩個變數的相關性。如下圖所示,confounder會導致觀測數據存在confounding association。而我們觀測到的數據,存在這兩種混合的相關性。而因果性也會導致一定的相關性,稱為causal association,但是由於confounding association的存在,我們觀測到的混合相關性無法直接推測出因果關係,所以相關性與因果性不同,也無法推出因果性!

相關性=因果性 ——-認知偏差 (cognitive bias)

雖然大家都知道相關性等於因果性是錯誤的,但是大家潛意識都會默認來使用這一點,這是由大腦思維存在一些固定思維傾嚮導致的認知偏誤

可以把穿鞋睡覺換成任何事情,任何與起床頭疼的可能存在相關的事情。

只是想找到一個解釋,來避免下次產生頭疼這件事。* 可以有如下來源

使用correlation=causation解釋
  1. availability heuristic:任何你想起最近的事情,比如喝了咖啡,你會認為喝了咖啡導致了我起床頭疼。(甚至很久以前你看過文章說咖啡不會導致頭疼。但那麼久的事情已經忘了)
  2. motivated reasoning:一般由個人的價值觀或世界觀誘導。比如,一個人不喜歡和岳父相處,則他會把頭疼這件事歸因於與岳父相處,給你一個理由來拒絕不想做的事情。

下一節講什麼導致因果!