酒駕是台灣社會高度關注議題,立法院今年上半年更接連三讀通過《道路交通管理處罰條例》和《刑法》修正案,希望多管齊下防制酒駕。台灣酒駕狀況到底有多嚴重?歷次修法是否實際影響了法官的量刑?目前的法規工具較缺乏的又是什麼?這是我們規劃這項專題時希望補足的討論。
從判決書中找線索,是我們想到的切入點。我們自司法院判決書網站蒐集全國22個地方法院,自2000年至2019年1月所有可能的酒駕刑事判決。經測試,我們決定以判決書全文出現「酒精」二字,作為最初的蒐集標準,抓下約59萬筆。
需要注意的是,並非所有的酒駕行為皆留下判決。酒駕自撞身亡的案件不會進入法院,檢察官予以「緩起訴」處分的案件,也不會面臨審判;近年「緩起訴」處分約占地檢署酒駕案件四分之一。
最初撈出來的59萬筆資料包含許多雜訊,未必精準指涉酒駕事件。如因偵測到「酒精燈」、「酒精濃度測試單」而撈入,或是當事人酒後傷害他人等。
因此,首先我們透過相關字詞的排列組合,篩選出真正的「酒駕」案件。經過測試,我們以「刑法第185條之3」、「不能安全駕駛」、「吐氣所含酒精濃度達每公升零點二五毫克以上」、「服用酒類」等字詞為篩選依據,初篩結果約51萬筆。
我們進一步將資料集區分為一般、致死、致傷三部分進行分析。
一般酒駕案件,除了上述確保為酒駕的關鍵字組合外,我們還排除主文含「死、傷」字眼的判決,「處」字出現次數也不能超過2次,希望讓這部分留下單純的「不能安全駕駛」案件。這部分最後篩出約48.8萬筆。
酒駕致死案件,除了套用酒駕關鍵字組合外,我們也以「致人於死」作為篩選依據,辨識出約2800筆。值得注意的是,歷次修法會影響案件主文寫法,例如從「過失致人於死」變為「不能安全駕駛動力交通工具而駕駛,因而致人於死」;若單純以「過失致人於死」為篩選依據,可能就會有缺漏。
酒駕致傷案件,我們以「過失傷害」作為篩選依據,辨識出約5200筆判決。
進行分析之前,我們以人工檢視判決書特性,找出可分析的欄位,再將文字資料結構化。
接著拆分出判決日期、所屬地院、是否累犯、是否易科罰金、不能安全駕駛刑度、不能安全駕駛罰金值、酒駕致死刑度、酒駕過失傷害刑度、是否緩刑、教育程度、車種、酒精濃度等欄位。
要將文字化為可分析的欄位並非一次到位,而是反覆經歷資料的探索,慢慢收斂出合適的製作方向,和精準的清洗規則。
清洗過程中的挑戰包括:將複雜的罪刑結構化。例如酒駕除了不能安全駕駛罪外,許多案件還可能牽涉過失致死、過失傷害、偽造文書、肇事逃逸、妨害公務等罪,最終也有一「合併執行」刑度;本專題以單一罪名之刑度為分析依據。
此外,各地院判決書寫法各異,文字、數字、甚至符號寫法多元,例如「一」與「壹」之分、數字的全半形差異,都是資料清洗的挑戰。
我們的資料分析方法一定不完美,資料抓取、篩選、分析過程可能皆有不足之處。為避免分析結果落入誤區,我們也請教學者、司法實務界人士的意見和看法。
另外,這次我們嘗試在各部分圖表加上資料範圍,讓讀者在看到結果之餘,亦能注意到樣本占比,知道分析結果立基於多少數據量。
最後,我們針對三個資料集隨機抽取100筆資料,以人工檢驗分析欄位,計算辨識正確的數量,結果如下表。
資料集 | 欄位 | 正確樣本(筆)/抽樣樣本(筆) |
一般酒駕 | 年分、地院、有期徒刑、罰金 | 100/100 |
車種 | 96/100 | |
酒精濃度 | 91/100 | |
教育程度 | 99/100 | |
酒駕致死 | 地院、有期徒刑 | 100/100 |
年分 | 99/100 | |
車種 | 92/100 | |
酒駕致傷 | 地院 | 100/100 |
年分、有期徒刑 | 99/100 | |
車種 | 93/100 |
以下為本專題研究方法可能的限制:
本專題分析資料來自司法院的公開之判決書。經過中央社數據處理的版本如下表所示。資料清理過程並非完美,可能仍有雜訊或不符的資料,使用或詮釋上請務必留意。下載相關檔案請至GitHub。
數據:柯皓翔、宋育泰
企劃:李怡瑩、黃淑芳
記者:蕭博文、劉世怡、盧太城、葉子綱、李先鳳、郭芷瑄、楊思瑞、吳睿騏、蘇木春、林長順
視覺:劉姿嘉、陳盈諭、郭秀文
網站:林琪