概率也會欺騙你
- 2019 年 11 月 30 日
- 筆記
有一道包含四個選項的單選題,你發現你完全不知道該怎麼做。在不考慮「三短一長選一長」「遇到不會就選 C」的玄學答題法時,你有一個機會去掉一個錯誤選項,然後就只能隨機瞎選。請問這時你選到正確答案的概率是多少?
老師,這道題我會答,是 1/3!
恭喜你答對了!沒去掉錯誤選項時,答對概率是 1/4,去掉就只剩三個選項了,所以是 1/3。

規則變一下,你先在四個選項中選一個,然後老師在剩下的三個選項中去掉一個錯誤答案,請問你要不要更改答案?
這就要看改與不改,正確的概率分別是多少了。
- 如果不改,因為老師總能去掉一個錯誤答案,這件事有沒有對你沒有任何影響(因為你沒改答案)。所以正確率仍為 1/4
- 如果改,沒去掉選項前剩下選項的正確率之和為 3/4,去掉一個錯誤選項,其他兩個選項的正確率為: 3/4 ÷ 2 = 3/8。所以改答案更優。

哈?
不懂沒關係,我們換個極端的情況,有 100 個選項,你選了 1 個,老師去掉了錯誤的 98 個,問你要不要改成沒去掉的那一個?
老師你當我傻比嗎?你沒去掉那一個,正確率是 99%!當然要改。
一個是先去掉再選,一個是先選再去掉,這裡面有什麼區別?
有區別,老師去掉錯誤答案時,是告訴你一個資訊:去掉的選項,是 100% 錯誤的。這樣你的概率空間就縮小了。100 個選項情況下,你選某一個時,概率空間仍是完整的,100 選 1。你選的正確率是 1%,剩下的 99 個選項平分 99% 正確率(每個 1%)。老師去掉了 9 8個錯誤選項,是告訴你這98個選項的正確率都是 0%。所以那個沒去掉的選項就獨得 99% 正確率。
有沒有資訊,能影響一件事情的概率分布。比如一個 6 位數的密碼,你什麼資訊也不知道,和你已知前 5 位數,猜對的概率有天壤之別。再看下一題:
- 已知老王有兩個孩子,老大是男孩,請問老二也是男孩的概率是多少?
- 已知老王有兩個孩子,其中有一個是男孩,請問另一個也是男孩的概率是多少?
- 已知老王有兩個孩子,老大是周二出生的男孩,請問老二也是男孩的概率是多少?
- 已知老王有兩個孩子,其中有一個是周二出生的男孩,請問另一個也是男孩的概率是多少?

冷靜!先把刀放下,我先揭曉一下正確答案:1/2, 1/3, 1/2, 13/27。
第一題,很簡單,獨立同分布,老大是男是女不影響老二的性別。1/2
第二題和第一題區別在哪呢?想像一下出題人出第一題的時候,他只需要看老大的性別就可以跑來問你了,可能老二他見都沒見到。但第二題呢,他可能觀察了兩個孩子的性別,然後告訴你其中有一個是男孩,問你另一個的性別。我們不知道這孩子是男是女,也不知道他是老大老二,它的概率空間比第一題要大了。有可能這個孩子是老大,是男孩,那老二是男是女都無所謂(根據題設)。也有可能這個孩子是老二,是女孩,那老大就必須是男孩。所以我們需要列出兩個孩子性別的聯合分布:男男,男女,女男,女女。女女這個情況已經被觀察者去掉了,所以剩下三種情況,另一個也是男孩(男男)的概率是 1/3。
當然,第一題也可以列聯合分布來做,去掉的是(女男、女女),剩下兩種情況,男男的概率是 1/2。可以發現,給定其中一個孩子的性別,另一個孩子性別的分布沒有變化,仍是 1/2,這就是獨立分布的意義。
第三題,同樣,出題人沒有給出任何第二個孩子的資訊,第二個孩子的性別是獨立的, 1/2。就算你說破大天,說老大是大隊長三好學生鋼琴十級,仍然沒有 P 用。老二是男孩子的概率還是 1/2。
第四題,出題人問的是另一個孩子的性別,又沒問星期幾齣生,你告訴我老大是周二出生有什麼用,Who TM cares? No, no, no(搖手指)。這就是多餘的資訊起到的微妙的作用。出題人也要觀察兩個孩子,問他娘,老王的媳婦他們是周幾齣生的,才能告訴你這個資訊。有三個維度:排行、性別、周幾齣生,概率空間又擴大了。我們用 B 表示男孩子,G 表示女孩,周幾齣生用 數字 表示,比如 2B 是周二出生的男孩。列出所有包含 2B 的情況:
| 2B 1B | 2B 2B | 2B 3B | 2B 4B | 2B 5B | 2B 6B | 2B 7B | | 2B 1G | 2B 2G | 2B 3G | 2B 4G | 2B 5G | 2B 6G | 2B 7G | | 1G 2B | 2G 2B | 3G 2B | 4G 2B | 5G 2B | 6G 2B | 7G 2B | | 1B 2B | 3B 2B | 4B 2B | 5B 2B | 6B 2B | 7B 2B |
其中兩個男孩的情況(第一行和最後一行)佔總數的 13/27,略小於 1/2。可以想像,條件給的越精確,這個數會越接近 1/2。
現在大家都喜歡把「薛定諤的貓」當段子講,其實它的原理跟上面的例子一樣:因為我們的觀察,獲得了資訊,導致了概率分布的改變。原來是一半生一半死,一觀察,就變成 100% 的生或死了。