【工作筆記】從49萬筆判決書 看見台灣酒駕輪廓 | 中央社媒體實驗室

從49萬筆判決書 看見台灣酒駕輪廓

Last Updated:2019.07.19

酒駕是台灣社會高度關注議題,立法院今年上半年更接連三讀通過《道路交通管理處罰條例》和《刑法》修正案,希望多管齊下防制酒駕。台灣酒駕狀況到底有多嚴重?歷次修法是否實際影響了法官的量刑?目前的法規工具較缺乏的又是什麼?這是我們規劃這項專題時希望補足的討論。

判決書蒐集

從判決書中找線索,是我們想到的切入點。我們自司法院判決書網站蒐集全國22個地方法院,自2000年至2019年1月所有可能的酒駕刑事判決。經測試,我們決定以判決書全文出現「酒精」二字,作為最初的蒐集標準,抓下約59萬筆。

需要注意的是,並非所有的酒駕行為皆留下判決。酒駕自撞身亡的案件不會進入法院,檢察官予以「緩起訴」處分的案件,也不會面臨審判;近年「緩起訴」處分約占地檢署酒駕案件四分之一。

找出真正的酒駕判決書

最初撈出來的59萬筆資料包含許多雜訊,未必精準指涉酒駕事件。如因偵測到「酒精燈」、「酒精濃度測試單」而撈入,或是當事人酒後傷害他人等。

因此,首先我們透過相關字詞的排列組合,篩選出真正的「酒駕」案件。經過測試,我們以「刑法第185條之3」、「不能安全駕駛」、「吐氣所含酒精濃度達每公升零點二五毫克以上」、「服用酒類」等字詞為篩選依據,初篩結果約51萬筆。

我們進一步將資料集區分為一般、致死、致傷三部分進行分析。

一般酒駕案件,除了上述確保為酒駕的關鍵字組合外,我們還排除主文含「死、傷」字眼的判決,「處」字出現次數也不能超過2次,希望讓這部分留下單純的「不能安全駕駛」案件。這部分最後篩出約48.8萬筆。

酒駕致死案件,除了套用酒駕關鍵字組合外,我們也以「致人於死」作為篩選依據,辨識出約2800筆。值得注意的是,歷次修法會影響案件主文寫法,例如從「過失致人於死」變為「不能安全駕駛動力交通工具而駕駛,因而致人於死」;若單純以「過失致人於死」為篩選依據,可能就會有缺漏。

酒駕致傷案件,我們以「過失傷害」作為篩選依據,辨識出約5200筆判決。

擬定問題,將判決書結構化

進行分析之前,我們以人工檢視判決書特性,找出可分析的欄位,再將文字資料結構化。

接著拆分出判決日期、所屬地院、是否累犯、是否易科罰金、不能安全駕駛刑度、不能安全駕駛罰金值、酒駕致死刑度、酒駕過失傷害刑度、是否緩刑、教育程度、車種、酒精濃度等欄位。

反覆清洗,進行探索式資料分析

要將文字化為可分析的欄位並非一次到位,而是反覆經歷資料的探索,慢慢收斂出合適的製作方向,和精準的清洗規則。

清洗過程中的挑戰包括:將複雜的罪刑結構化。例如酒駕除了不能安全駕駛罪外,許多案件還可能牽涉過失致死、過失傷害、偽造文書、肇事逃逸、妨害公務等罪,最終也有一「合併執行」刑度;本專題以單一罪名之刑度為分析依據。

此外,各地院判決書寫法各異,文字、數字、甚至符號寫法多元,例如「一」與「壹」之分、數字的全半形差異,都是資料清洗的挑戰。

本專題數據清洗程式碼,可見清洗流程介紹GitHub

合宜的詮釋

我們的資料分析方法一定不完美,資料抓取、篩選、分析過程可能皆有不足之處。為避免分析結果落入誤區,我們也請教學者、司法實務界人士的意見和看法。

另外,這次我們嘗試在各部分圖表加上資料範圍,讓讀者在看到結果之餘,亦能注意到樣本占比,知道分析結果立基於多少數據量。

最後,我們針對三個資料集隨機抽取100筆資料,以人工檢驗分析欄位,計算辨識正確的數量,結果如下表。

資料集 欄位 正確樣本(筆)/抽樣樣本(筆)
一般酒駕 年分、地院、有期徒刑、罰金 100/100
車種 96/100
酒精濃度 91/100
教育程度 99/100
酒駕致死 地院、有期徒刑 100/100
年分 99/100
車種 92/100
酒駕致傷 地院 100/100
年分、有期徒刑 99/100
車種 93/100

限制

以下為本專題研究方法可能的限制:

  • 資料集為地院刑事判決書,不包括上訴、地檢署緩起訴及酒駕自撞身亡案件。
  • 判決書撈取過程,資料可能有遺漏或重複。
  • 透過關鍵字組合,篩選一般酒駕、致死、致傷資料集,仍可能有所遺漏。
  • 部分判決書文字出現亂碼,無法精準辨識。
  • 判決書寫法差異大,各欄位未必能完全精準辨識。
  • 【判決書數量】案件多寡未必等同於嚴重度,需考量人為因素。例如第一線攔檢頻率、案件到地院時是否給予緩起訴,都是可能影響因子。
  • 【地區】分析是以地院為單位,台北、基隆、新北、士林、高雄、橋頭地院之轄區和實際行政區劃有別。又板橋地院2013年改制為新北地院,橋頭地院於2016年9月成立,分擔高雄地區業務量。
  • 【濃度】未具體寫明酒精濃度者,以判決書提到之最低門檻為準。
  • 【刑度】分析是以單一罪名的宣告刑為依據,然實際上當事人可能以易科罰金方式執行;當事人亦可能觸犯其他罪,而有合併執行刑度。
  • 【公訴不受理】過失傷害罪屬於告訴乃論,若主文寫到該部分公訴不受理,當庭和解是可能原因之一,而非唯一。

資料公開

本專題分析資料來自司法院的公開之判決書。經過中央社數據處理的版本如下表所示。資料清理過程並非完美,可能仍有雜訊或不符的資料,使用或詮釋上請務必留意。下載相關檔案請至GitHub。

資料集 下載連結
一般酒駕 2000 2001 2002 2003 2004 2005 2006 2007 2008 2009 2010 2011 2012 2013 2014 2015 2016 2017 2018 2019(僅至1月)
酒駕致死 2000-201901
酒駕致傷 2000-201901

問卷調查

最後,想邀請您填寫讀者問卷(作答時間約3分鐘),您的意見將有助於我們未來製作出更豐富、更精彩的新聞專題。

powered by Typeform

製作團隊

數據:柯皓翔、宋育泰

企劃:李怡瑩、黃淑芳

記者:蕭博文、劉世怡、盧太城、葉子綱、李先鳳、郭芷瑄、楊思瑞、吳睿騏、蘇木春、林長順

視覺:劉姿嘉、陳盈諭、郭秀文

網站:林琪