諮詢師Barry Devlin介紹了一些人們因為統計資料分析不當而誤解風險的案例,同時闡述了為什麼業務決策不能完全由資料驅動。他提醒企業要清醒認識資料科學家的陰謀,同時接受普通業務人員的天真想法。

大資料分析

大資料分析的擁護者竭盡全力地鼓吹“資料驅動”,明智的人應該謹慎對待,並明確兩個問題。一,業務人員在制定特定決策時是否真正理解相關資料,是否曾經以實用且可行的方式向管理層展示了這些資料?二,是否所有決策都有必要在收集“所有資料”之後自動完成?

在《認清風險:如何作出好決策》(Risk Savvy: How to Make Good Decisions)中,德國柏林Max Planck人類發展研究所管理主管Gerd Gigerenzer闡述了公共環境中風險測量與決策過程的問題,他的觀點同樣適用於商業領域。

首先,我們看看Gigerenzer舉的一些例子。它們說明了大多數人所獲得的統計資料只是很小一部分,而且我們很容易因為資料的不正確性或明顯誤用而產生錯誤結論。

在911事件的一年時間裡,成千上萬的美國人放棄乘坐飛機,轉而選擇開車長途遠行,因為他們害怕遇到相同的襲擊。高速公路行駛距離因此增長了5%,而道路交通意外死亡人數在一年裡逐月上升,已經超過了過去五年的平均水平。此外,粗略計算有約1,600人喪身交通意外,而航空旅客及空乘人員的傷亡人數只有256人,其中還包括911事件的傷亡數字。

由於對當時傷亡事件產生了主觀反應,美國公眾完全忽視了有效的統計風險測量結果,即飛機的安全係數要遠遠高於汽車。

錯誤的風險測量方法

1995年,英國醫藥安全委員會發布了一系列研究結果,服用第三代口服避孕藥的人患血栓症的概率是普通人的兩倍。這個研究結果很快傳遍全世界。醫生與藥劑師向婦女傳達了由預期結論得出的警告資訊:意外懷孕與妊辰激增。接下來的一年時間裡,僅僅在英格蘭和威爾士流產案例預計增加了13,000人次。

儘管這些專家都經過科學和醫學培訓,但是他們嚴重忽視或忽略一個結果:絕對風險數量增加一倍才只有7000人次,也遠遠不及由懷孕與流產導致的血栓症風險。因此,相同的資料有兩種描述方式:一是風險率相對增長100%,二是絕對增長數量為7,000。前者很容易佔據新聞頭條和引起公眾跟風。而後者則不會造成太大影響,但是可能會避免很多痛苦。

Gigerenzer的書還有很多這樣的故事,如果你有興趣瞭解人們解讀數字資料的方式及使用(或不使用)這些數字作為決策依據的方式,那麼這本書很值得你閱讀。事實是,即使經過科學訓練,只有極少數人能夠正確理解這個領域。因此,我們缺少區分不同風險表達方式及不確定性的能力,也缺乏一些幫助理解所得到結果的培訓。對於世界上的一些概念,我們很容易陷入偏見或先入為主的錯誤理解方式。

當我們從“少量資料”世界(掌握簡單算術就足夠應付)過渡到充斥大資料統計的世界時,資料誤解產生的危害也出現指數增長。無論自助服務商業智慧有多厲害,它們也無法輕鬆擴充套件變成自助服務商業分析。業務使用者(及許多資料科學家)都需要在理解和展示統計資料方面加強自身的能力。

最大的決策動因:潛意識行為

除了技能問題,還有一個更根本的問題,而911事件關於航空旅行方式的態度改變就是一個最好的例子。我將這種現象稱為商業不智慧(Business unIntelligence),並且在我的同名圖書中提出了這個術語。按照西方商業思維方式,智慧幾乎可以完全等同於合理和理智思想,特別是在決策過程中。這忽略了大腦的現實情況及其思維過程,其中有90%的想法是無意識發生的。決策很少是由資料驅動的,特別是那些會對個人產生影響或需要快速響應的決策。

心理學家及諾貝爾經濟學獎得主Daniel Kahneman在他寫的書《快思考與慢思考》中闡述了這個話題,但是他落入唯理性主義者的圈套,後者認為無意識思維源於有意識思維。這樣就得出了一些結論:我們很容易作出一些嚴重錯誤且非常容易受外界干擾的決策,而且總是在有意識地保護自己。或者更壞的情況是,一些專制政府可能且總是會“迫使”我們作出一些有利於自身的決策。

當然,自我意識也很重要。然而,如果認為我們新進化的小小前額可以或應該完全超越大多數大腦的長期進化但潛意識發生的感知,那麼這是極其短視的。這種感知對於現實世界的決策過程有很多影響——形式包括內在感受、直覺、有根據的揣測和探索,而它們會忽略得到的大部分資料。如果只關注於收集和堆砌不斷增多的資料,那麼我們就有迷失的風險。

在不確定的世界裡,有一些事件是無法預測的,基於資料分析出來的概率只能讓人得到一個決策。2008年金融領域發生的事件表明,過份依賴於預測風險模型是災難性的,因為有一些東西不在模型引數的覆蓋範圍之內。Gigerenzer指出:“問題在於不正確的風險測量:這些方法錯誤地假定不確定的世界裡有已知的風險。因為這些計算為一個不確定的風險產生了精確的數字,因此它們會產生一個虛假的確定性。”

在決策過程中完全依賴資料驅動或分析工具本身具有內在的危險性。人類決策者所帶來的價值是他能夠看到環境和理解業務環境。這些洞察力並不能完全由引數來描述。當然,它們也來源於一些資訊:思想認識中的舊記憶或新思維模式。但是,它們大多數都基於電腦科學遠遠無法理解的思維處理模型,計算機還完全無法模擬出思維。這是一個寶貴的東西。

End