許多關鍵時刻的重要問題,並不是動動手指就能搞定。為什麼從Google、Apple、微軟到SpaceX面試時,都要問那些怪問題?因為,真正重要的不是答案,而是大腦思路──看面試者如何取捨眼前資訊,並找到可行方法。放下計算機,跟著最會說故事的數學家,從最基本的邏輯上手,小至餐廳帳單、大至浩瀚宇宙,都比人早一步得到答案。不管是數據分析還是市場觀察,一本書抓住問題根本,逐步建立看清大局的全方位思考力。
內容節錄
《世界上有多少隻貓?:超速估算出一切事物,讓你看清大局的數字反應力》
反映真實的粗略資訊(節錄自第1章〈你以為的精確,其實很危險〉)
在2017年5月的大選中,倫敦肯辛頓選區(Kensington)出現了令人震驚的結果。現任議員是保守黨,上次選舉的得票狀況很好。但週五一早,有消息指出結果太接近,將重新計票。幾個小時後,又宣布需要第二次重新計票。情況依然無法解決,選務人員只能休息幾個小時,然後隔天回來繼續進行第三次重新計票。
最終,選舉監察官確認了選舉結果:工黨的科德(Emma Dent Coad)擊敗了保守黨的博維克(Victoria Borwick)。
不過差距非常小。科德僅以20票之差勝選,她得到16,333票,而博維克得到16,313票。
你可能會認為,假如有個連個位數都可以相信的數字,那必定是經過數算而得出的數字。
然而事實是,就算像計票這種基本的事情也容易出錯。計票員可能不小心拿起兩張黏在一起的選票。他們很累的時候也可能犯錯,數著「28,29,40,41……」,又或者,他們可能會覺得選票上有太多標記,而喊出廢票──但其他計票員可能會接受。
根據過往經驗,一些選務官員估計人工計票的誤差會在約1/5,000(或0.02%)的範圍內,所以在像肯辛頓這種選舉中,每次計票的結果可能會有多達10票的差異。
每次重新計票的結果通常會略有不同,但依然無法保證哪一次計票的數字才是正確的──假如真有一個正確數字的話。(在以激烈聞名的2000年美國大選中,佛羅里達州的選舉結果最終取決於一項裁決,即未完全打孔、有紙片殘留的投票卡是否屬於有效票。)
一般來說,如果計票時的錯誤不足以影響結果,那就不會啟動重新計票。所以結果越接近,就越有可能重新計票。英國大選曾經發生過兩次重新計票七次的事件,兩次都是在1960年代,最終的差距皆少於10票。
這一切都表明,在宣布像科德這樣的候選人得票為16,333票時,實際上應該用更模糊的表達方式:「極可能在16,328到16,338票之間」(或者簡寫為16,333 ± 5)。
如果連實體選票數量這種相對容易確定的數字都無法相信,那麼我們怎麼可能準確計算出其他更難捉摸的事物呢?
在2018年,美國的兩個卡羅萊納州被佛羅倫斯颶風襲擊,這場巨大風暴使某些地方的雨量高達50英寸。在一片混亂中,有大量的房屋都停電了好幾天。9月18日,CNN的新聞如下:
根據美國能源資訊管理局的數據,週一上午停電的用戶數量為511,000人。其中,北卡羅萊納州有486,000人,南卡羅萊納州有15,000人,維吉尼亞州有15,000人。不過在週一晚間,北卡羅萊納州的停電用戶已經降為342,884人。
在這則簡短的報導中,大部分篇幅所引用的數字單位是千。但突然我們在最後看到,無電可用的人數已經下降到342,884。就算這個數字是真的,也只在整理出的當下幾秒內,因為停電用戶的數量是不斷變化的。
就連週一上午北卡羅萊納州的數字486,000也有點可疑,這個數字包含了三個有效數字;而另外兩個州則是15,000──這看起來像是以5,000為單位,經四捨五入得出的。如果把這些數字加總,就能發現:15,000 + 15,000 + 486,000 = 516,000。比新聞開頭的總數511,000高出5,000。
所以在引用這些資料時有選擇的空間。他們可以給出一個範圍(「大約在300,000到350,000之間」),或者直接將數字四捨五入,只留下一個有效數字,再加上「大約」這個限定詞(「大約是500,000」)。這可以清楚說明,這些並不是確定的數字,無法經由重新計算來還原。
事實上,有時候甚至連說「大約」也沒辦法。
英國國家統計局(The Office for National Statistics)每個月都會公布最新的英國失業數據。這當然有新聞價值。失業率的波動是經濟狀態的一個良好指標,與每個人息息相關。2018年9月,統計局公布英國失業人數比上月下降55,000人,降至1,360,000人。
問題在於這個數據並不是很可靠,國家統計局對此也有自知之明。他們在公布2018年的失業數據時,還補充了一個細節,就是他們有95%的信心,這個數據的誤差值會在69,000以內。換句話說,失業人數減少了「55,000正或負69,000」,表示實際上可能減少了多達124,000人,也可能增加了14,000人。假如事實是失業人數增加,那新聞風向會完全不同。
如果誤差幅度已經大於你所引用的數字,那你根本沒有理由繼續引用,更別提引用超過一個有效數字了。他們最好的說法是:「上個月的失業人數可能有下降,人數可能落在大約50,000人。」
一個約整過、不太精確的數字,往往會比一個精確的數字更能反映真實狀況。以上就是一個好例子。