圖表軸線暗藏陷阱 華盛頓大學教授揭穿數據的假象【書摘】
(中央社網站)假新聞是當今最受討論的議題之一,大部分網路使用者已經知道要留意不實資訊。然而不實的文字內容只能算是最粗淺的招式,真正厲害的陷阱往往藏在文章裡的統計數據、圖表。
華盛頓大學教授卡爾柏格斯姆特(Carl T. Bergstorm)與杰文威斯特(Jevin D. West)運用統計與生物學領域的專業知識,在新書《數據的假象》以一系列的實際案例,帶讀者識破數據資料中不合邏輯的破綻,從圖表軸線的單位大小、柱狀圖的長度,到0點在圖表中的位置,都可以成為混淆視聽的工具。中央社取得授權與您分享相關內容:
邪惡之軸
有心也好,無意也罷,數據資料視覺化也可能誤導視聽,所幸的是如果你知道自己想看的是什麼,就能輕易地揪出這種欺騙行為。
許多數據資料圖會循著軸線呈現資料,柱狀圖和散布圖就屬這一類。這些軸線是構成數值圖的橫向與縱向尺標,當數據資料圖內含軸線時,務必加以檢視。
設計者有幾招操弄圖表軸線的騙術。2016年時,身兼教授一職的專欄作家安德魯.波特(Andrew Potter)在加拿大的新聞雜誌《麥克林雜誌》(Maclean’s)裡發表一篇引起眾怒的評論。他為文聲稱魁北克有許多問題,追根溯源就是因為「和國內其他地方相比,魁北克的社會幾乎孤立隔絕又充滿不信任感,也缺乏其他加拿大人視為理所當然的最基本社會資本。」雜誌為了支持波特的論點,刊出以下這張數據資料圖。
乍看之下,這張圖好像提供支持波特的立論的強力數據。跟加拿大的其他地方相比,魁北克代表信任的條形短少許多。不過,等一下,讓我們看看縱軸(Y軸)。這些條形不是從0開始起算的。它們分別從35、45、和50起算。設計者只保留魁北克條形頂部的一小部分,其餘全遭截除,如此視覺上便誇大魁北克與加拿大其他地方的差距。如果這些條形一直向下延伸到0的話,下頁圖表給人的印象會有所不同。
在這個新的視覺化裡,我們看到魁北克的信任程度的確較低,但起碼我們對於信任程度的差異量比較有概念。這個圖的視覺化才是雜誌一開始就該刊登的,待讀者發現原本的圖表軸線被人動過手腳、投書抗議之後,麥克林雜誌才刊登此圖以為修正。
柱狀圖不一定得具備明確的軸線才能誤導視聽。以下是希拉蕊.柯林頓的選舉團隊張貼在Instagram上的例子。
此圖中的條形並非由下到上,而是由左至右。這麼做是適當的,因為各個長條純粹代表不具任何固有順序的數值(例如年份、年紀、收入範圍等)。此圖不適當之處在於每個條形長度看似與代表之數值成比例,實際卻非如此。就長度而言,前4個條形由左至右的總長與自身代表之數值相當接近。既然條形表示數值,最後兩個就遠超過所該呈現之長度。白人女性的標示值為75%,不過條形卻被延伸到右端點的78%。亞裔女性的條形更讓人產生誤解。儘管它標示值為84%,條形卻則被延伸到右端點的90%。效果就是要誇大美國非亞裔有色人種女性跟白人與亞裔女性間感受上的工資差異。我們可以讀取條形上的數字,但感受到的卻是條形長度的差別。
柱狀圖的條形理應延伸至0點,但折線圖的應變數軸則不一定得包含0點。以下的折線圖是1970年以降,加州雙薪家庭占比變化的示意圖。與魁北克那張原始信任圖表相同,本圖也使用沒有延伸到0點的縱軸。
兩者差別何在?為什麼柱狀圖的縱軸需要包含0點,折線圖就不必?因為這兩種圖訴說的是不一樣的事。柱狀圖的設計目的,就是要強調與每一類項相關的絕對值;折線圖強調的則是應變數(通常是縱軸上的值)隨自變數(通常是橫軸上的值)改變時的變化情形。
事實上,折線圖的縱軸倘若真的包含0點,有時還可能誤導視聽。一張名為「從現在起只要靠這張就好的全球暖化圖表」(The Only Global Warming Chart You Need From Now On)就是惡名昭彰的例子。該圖原為美國保守派作家、史蒂芬.海沃德(Steven Hayward)替保守派新聞評論網站PowerLine創作的表格,後來因為《國家評論》(National Review)雜誌在2015年下半年將其張貼於推特上,又被大家進一步轉載分享。海沃德解釋自己的圖時如此寫道:這下讓人很難激動,可不是嗎?事實上,你幾乎看不出暖化。
這真是愚蠢!絕對溫度根本無關緊要。沒道理放大到如此程度導致無從觀察型樣。假如我們想得出氣候是否改變的結論,需要的是像下圖這樣的比例。
PowerLine那張圖表不坦誠的地方,是海沃德選擇一個跟自己要說的事情不一致的圖表呈現方式。他聲稱自己提筆討論的是地球的溫度變化(或無變化),但卻不選擇可以顯露變化值的圖,倒採用模糊變化值而有利於絕對值的圖。
(編輯:林傑立)1110609
書名:數據的假象:數據識讀是深度偽造時代最重要的思辨素養,聰明決策不被操弄
作者: 卡爾‧伯格斯特姆 , 杰文‧威斯特
譯者: 穆思婕, 沈聿德
出版社:天下雜誌
出版日期:2022/06/01
本網站之文字、圖片及影音,非經授權,不得轉載、公開播送或公開傳輸及利用。