暗數據

發稿時間:2021/06/18
暗數據
暗數據
作者|大衛‧漢德
譯者|賴盈滿
出版社|大塊文化
出版日期|2021/05/27

  看不見的,不代表不存在。身處大數據時代,不難以為我們擁有做出好決定的一切數據。但資訊世界也充滿了暗數據,為我們所無視,非常危險。本書探討許多對於暗數據視而不見的情況,討論這些情況如何讓我們做出錯誤、危險,甚至災難性的結論與行動。作者不僅教導我們要對未知事物造成的問題提高警覺,也闡述如何利用暗數據,從中得益,讓我們得到更深入的理解,做出更好的決定。如今我們所有人都仰賴數據做決定。本書將告訴我們如何避免做出壞的決定。

文章節錄

《暗數據:被看到、被聽到、被測量到的,往往不是「真凶」》

數據鬼魂

  讓我先從一個笑話講起。

  前幾天我在路上遇見一位老人,他走在馬路中央,每隔五十步左右就在路上撒一小堆粉末。我問他在做什麼,他說:「我在撒大象粉。大象受不了這種粉末,所以都不會靠近。」

  我說:「但這裡沒有大象。」

  他回答:「沒錯!你瞧這粉末多有效!」

  笑話講完了,來點正經的。

  全球每年有將近十萬人死於麻疹,每五百名感染者就有一人死於併發症,其餘則是終生耳聾或大腦受損。幸好該傳染病在美國極為罕見,一九九九年只有九十九起通報病例。然而,二○一九年一月華盛頓州麻疹爆發,導致該州宣布進入緊急狀態,其餘各州的通報病例也顯著增加。美國以外的國家也有類似情形。二○一九年二月中旬,烏克蘭的麻疹爆發病例已經超過二萬一千例。歐洲二○一七年有二萬五八六三例麻疹,二○一八年卻暴增高達八萬二千多例。羅馬尼亞從二○一六年元旦至二○一七年三月底,則有四千多起麻疹通報病例,造成十八人死亡。

  麻疹是可怕的惡疾,由於感染之後要過幾週才會有明顯症狀,很容易悄悄蔓延而不被察覺,根本還不曉得它在傳播,就已經被感染了。

  然而,麻疹是可以預防的,只要接種疫苗就能免於被傳染的風險。而美國施行的全國免疫計畫也確實非常成功,應該說太成功了,使得施行這類計畫的國家的大多數家長,一輩子都沒見過或經歷過這種可預防疾病的可怕。

  因此,當政府建議家長帶孩子去打疫苗,好預防這種他們從來沒見過或聽過親朋好友左鄰右舍得過、疾病預防管制中心還曾宣布絕跡的疾病,家長自然會對這樣的建議半信半疑。

  為了不存在的東西挨一針?感覺就跟撒大象粉一樣。

  只是麻疹和大象不同,威脅並未消失,始終千真萬確。只不過家長遺漏了做決定所需的資訊與數據,所以才看不到風險。

  凡是遺漏的資訊與數據,我一概以「暗數據」(dark data)稱之。暗數據隱而不顯,單憑這點就可能導致誤解、錯誤結論及壞決定。簡單說,就是無知會讓人出錯。

  暗數據一詞發想自物理學的暗物質(dark matter)。宇宙有二七%由這種神祕物質構成。由於它不跟光和電磁輻射作用,肉眼不可見,進而使得天文學家長年不知其存在。直到觀察星系旋轉,發現距離星系中心較遠的星體移動速度並不比距離較近的星體慢,違反我們對重力的理解,天文學家才察覺不對。於是,有人假設星系的總質量比望遠鏡觀察到的星體和其他物體的質量總和還大,這樣就能解釋星系旋轉的反常現象。由於我們看不見那多出來的質量,所以稱之為暗物質,而且這種物質可能分量(我差點就說「質量」)驚人:據估計,我們所在的銀河系擁有的暗物質是一般物質的十倍左右。

  暗數據與暗物質很類似──我們見不到那些數據;那些數據沒有紀錄,卻會大大影響我們的推論、決定與行動。本書稍後將會舉例說明,除非我們察覺四周潛藏著未知的事物,否則後果可能不堪設想,甚至致命。

  本書嘗試探討暗數據如何出現,以及為何出現。書中將檢視各種暗數據;瞭解這些數據的成因;說明哪些步驟可以避免暗數據出現,防範未然;介紹察覺自己被暗數據蒙蔽時該如何處置;最後指出只要夠聰明,有時還能利用暗數據,從中得益。雖然聽來奇怪又矛盾,但我們確實能夠利用無知和暗數據,思考做出更好的決定與行動。說得更具體一點,就是讓我們生活得更健康、賺更多錢,並明智運用未知來降低風險。這不代表我們應該對別人隱瞞資訊(雖然本書之後幾章會提到,刻意隱瞞的數據是常見的一種暗數據),實際作法比這複雜許多,而且所有人都會受益。

            (文未完)

本網站使用相關技術提供更好的閱讀體驗,同時尊重使用者隱私,點這裡瞭解中央社隱私聲明當您關閉此視窗,代表您同意上述規範。
close-privacy