5人法則:小樣本也有力量

  • 2019 年 10 月 6 日
  • 筆記

案例

假如,你想知道你們公司每個員工的通勤時間是多少。而公司員工有上千人,一個一個問太費時。你並不需要得到精確的結果,有沒有好的辦法呢?

有一個簡單的辦法:你只需要隨機問5個人即可!

假設你得到的答案是:30分鐘、50分鐘、40分鐘、60分鐘和45分鐘。 這5個數字的最小值為30,最大值為60。那麼,你就可以斷定:所有員工通勤時間的中間值,有93.75%的可能性在30~60分鐘之間。

原理

上面用到的方法叫5人法則。該方法之所以有效,是因為它估計的是群體的中間值。所謂「中間值」(或中位數),就是群體中有一半的值大於它,一半的值小於它。

假如我們隨機選的5個都大於或都小於中間值,那麼中間值就在30~60的範圍之外。這樣的情況概率有多大呢?

根據定義,隨機算一個值,其大於中間值的概率是50%。這個扔一個硬幣,正面朝上的概率是一樣的。隨機選擇5個都大於中間值的概率,等於連續扔5次硬幣全部正面朝上的概率。這樣的概率是1/32,即3.125%。同樣,所有5個都小於中間值的概率也是3.125%。

中間值在5個人範圍(30~60)的概率 = 100% – 3.125% – 3.125% = 93.75%

有時候,一個好的測量方法,能夠大大節省成本!

相關文章

Elasticsearch全文檢索與餘弦相似度

推薦引擎演算法 – 猜你喜歡的東西