這是一個真實的故事,發生在作者所在的公司,本文中的名稱、演算法地址都已修改以保護利益相關的作者。
A 公司已經成立幾十年了。它在行業裡雖然不是領頭羊,但口碑還不錯。自 20 世紀 90 年代起,A 公司的核心業務就一直是風險分析和投資組合優化。他們有一個大約 30 個分析師組成的龐大團隊,這些分析師每天都在執行這些任務。他們利用 ERP 大公司(如 SAP、天睿、甲骨文、JD Edwards)或主要技術諮詢公司(如德勤、埃森哲、普華永道、凱捷)為其定製的 ERP 方案與公司內部的工程團隊合作。
他們所使用的工具非常老派:執行在 on-prem 伺服器或主機上的經典關聯式資料庫管理系統、用 COBOL 或 Fortran 編寫的程式碼、像 ABAP 或 SPSS 這樣奇怪的東西……你大概明白了吧。但其模型和分析功能相當複雜,而且和已發表的學術文獻相比,它驚人地先進。最重要的是,它們非常適合公司的企業生態系統,並且是基於多年深厚的領域知識磨鍊出來的。
他們的技術團隊有幾個工程師(從上述軟體和諮詢公司挖過來的)和產品經理(使用該軟體的有經驗的分析師或經理,或從競爭對手那裡挖過來的),這些人負責維護和執行該軟體。他們的技術可能有點老派,但總的來說,他們非常瞭解公司和這個領域的整體架構。
他們指導公司進行了幾次大規模的升級和遷移,他們總是按時交付,沒有過多開銷。即使有幾次被絆倒了,他們也知道如何快速爬起來。在業內,他們以專業而著稱,並且與必須打交道的各路供應商都擁有非常好的關係。他們成就了多個 ERP 諮詢人才的職業生涯。
有趣的是,雖然他們每天都在處理統計建模和優化演算法,但沒有一個分析師、工程師或產品經理自稱是資料科學家或機器學習專家。這主要是一種文化現象:他們的專業知識早於 2010 年左右開始的資料科學/機器學習炒作,他們大部分是使用專有的企業工具而不是現在流行的開源工具。他們當中只有少數人接受過正式的統計培訓,但大部分人來自工程或領域背景,然後在工作中不斷學習統計資料。暫時就把這個團隊叫做「X 團隊」吧。
大約在 2015 年左右,A 公司開始出現一些嚴重的焦慮問題:雖然作為這種規模的公司,它仍然做得很好。但由於整體的經濟和人口發展趨勢,它的客戶群正在縮小。一些所謂的攪局者提出了一種新的應用和商業模式,開始嚴重侵蝕其收入。適當地安撫股東和華爾街是必要的。該公司已經有了一個不錯的網站和一個相當有吸引力的應用,此外還要做什麼呢?
領導層決定,應該把人工智慧和機器學習作為公司的核心業務。一個雄心勃勃的經理,沒有理工科背景,僅在幾年前短暫地擺弄過推薦系統,被選中來組建資料科學團隊,暫且將該團隊稱為「Y 團隊」(他在當地州立大學獲得了歷史學士學位,並在公司的市場部工作了幾年)。
Y 團隊主要由內部僱員組成,這些人想成為資料科學家,並且在加入團隊之前完成了 Coursera 認證或 Galvanize boot camp。該團隊還有幾個剛畢業但不喜歡學術界想投入業界的博士或碩士。這些人都很厲害,可以寫非常棒的 Medium 部落格,發表鼓舞人心的 TED 演講,但總體來說,他們幾乎沒有什麼行業經驗。
和現在流行的做法一樣,Y 團隊直接向 CEO 和董事會報告資料科學相關工作,繞過資訊長(CIO)和任何技術或業務副總裁(VP),因為 A 公司想在其即將召開的股東大會上宣稱這些是「資料驅動」和「AI 驅動」的。在三四年的時間裡,Y 團隊製作了一些 Python 和 R 指令碼。他們的架構經驗幾乎完全是將 Flask 連線到 S3 bucket 或 Redshift,其中更聰明一點的會學習如何將其模型插入 Tableau 或如何旋轉 Kuberneties pod。
但是他們並不擔心:上述組建該團隊的經理現在是一名董事(同時還在讀線上碩士課程,以彌補資歷差距,增加其晉升為 VP 的機會。至少他現在知道 L1 正則化是什麼了)。他同時也是一位玩辦公室政治和自我推銷的大師。不管 Y 團隊提出的可行見解有多麼少,或者他們部署到生產中的程式碼是多麼一丁點兒,這位經理都支援他們,並且確保他們有充足的資金。事實上,他現在有一個巨集偉的計劃——建立一個通用的機器學習平臺來解決公司所有的資料問題。
Y 團隊有一些頭腦清醒的成員,在將他們所處行業的名稱與「資料科學」一詞聯合搜尋之後,他們意識到貝葉斯模型是風險分析的主要解決方式,而且已經有一個足夠完美的 R 語言工具包來處理這樣的問題了。他們在 R-Bloggers.com 上研究了相關的教程。這個團隊的成員之一甚至在 Kaggle 資料競賽平臺上提交了貝葉斯分類器的核心(在排行榜上排名 203 位),而且正準備將自己新發現的知識用於解決現實世界的問題。
他們將自己的想法告訴主管,後者認為已找到即將推出的機器學習平臺的完美應用方向。他們立即開始了工作,完全沒有檢視 A 公司是否有人已經在做風險分析。由於他們的組織是獨立的,所以在接收資金之前他們完全無需與他人核對這些問題。儘管他們所做的僅僅是一個純貝葉斯分類器,「機器學習」字眼被加在了工程專案的名稱上,用來打動董事會。
但是,隨著工作的進展,緊張氣氛開始出現。Y 團隊要求資料倉儲和 CA 分析團隊建立管道,最終這個專案傳到了 X 團隊的耳中。X 團隊剛開始很興奮:表示願意全心全意與 Y 團隊合作,並且很想在運作過程中新增機器學習這個助力。產品負責人和分析師也完全參與其中:他們看到了炒作整個資料科學的機會。但是由於傲慢的態度和不安全感,Y 團隊拒絕與 X 團隊合作或者與 X 團隊分享自身的長期目標,即使他們去了公司其他部門,並就自身建立的新模型進行 brown 包演示和教程展示。
X 團隊生氣了:從他們對 Y 團隊的模型觀察來看,他們的方法天真得無可救藥,並且幾乎沒有擴大生產規模和實現可持續性的可能,他們知道如何為 Y 團隊提供幫助。考慮到 Y 團隊對 DevOps 的熟悉程度和持續交付(Y 團隊耗費幾個月的時間搞清楚瞭如何將一個簡單的 R 指令碼部署到產品中),將該模型部署到產品中需要花費幾天時間。
儘管 X 團隊自己的技術已經過時了,但他們依然足夠聰明,能夠將這些技術嵌入到現有架構中。此外,該模型的輸出並沒有考慮到公司如何使用它或者如何將它傳達至下游系統,並且產品負責人可能也需要花費大量精力使該模型更易於被利益相關者採納。但是,Y 團隊並沒有聽取建議,他們的領導拒絕了任何溝通嘗試,更不用說合作了。
Y 團隊釋放出來的訊號是「我們是最前沿的 ML 團隊,你們的觀點都太過時了。我們不需要你們的建議」,並且他們似乎完全忽視領域知識,或者更糟的是,他們認為所有的領域知識只需要掌握一些商業指標的定義就行了。
X 團隊感到非常沮喪,並試圖將自己的擔憂傳達給領導層。但儘管 X 團隊掌握著 A 公司業務流程中的重要一環,但他們只是一個 50 人團隊,這在一個有 1000 名員工的科技與運營大公司裡顯得微不足道。此外,他們與最高管理層之間也隔了好幾環,因此管理層幾乎不可能聽到他們的建議。
與此同時,這位勢不可擋的主管做了他最擅長的事情:玩弄公司政治。雖然自己團隊實際交付的東西很少,但他已經說服了董事會,所有的分析和優化任務現在都應該遷移到他尚未交付的 ML 平臺上。
由於多數領導現在已經知道 Y 團隊和 X 團隊目標存在重疊,他的遊說詞不再是 Y 團隊將要創造一個新理念,而是他們將要取代(或者現代化)基於 on-prem 工具的傳統統計和基於雲的 ML 工具。儘管沒有學術文獻支援樸素貝葉斯比 X 團隊所使用的計量經濟方法更有效的觀點,更不用說貝葉斯優化(Bayesian Optimization)肯定優於生產中執行的 QP 求解器的古怪想法了。
X 團隊不知道的是,原始貝葉斯風險分析專案現在已經發展為一項耗資數百萬美元的重大改革計劃,其中包括最終取代該團隊所支援的所有工具和功能以及必要的雲遷移。CIO 和幾位 VP 現在都已上任,並且技術領導認為事情已經木已成舟。
由於 Y 團隊沒有工程技能,因此一家外部供應商——一家沒人聽說過的創業公司被簽約幫助構建這個平臺。這個選擇是慎重的,因為要求任何已有的諮詢或軟體公司做這件事的話,最終只會讓領導層得出 X 團隊在轉型上要比 Y 團隊做得好的結論。
相比之下,Y 團隊沒有重要 ERP 部署經驗,也沒有領域內的知識,但他們的任務卻是從根本上改變 A 公司核心業務的工作流程。他們的模型實際上要比 X 團隊部署的模型差,對於真實的生產環境來說,他們的架構過於簡單。
具有諷刺意味的是,所有跡象表明,Y 團隊使用貝葉斯方法獲得成功的概率接近於零。
最好的情況下這個專案最終會在消耗掉 5000 萬或更多美元的情況下被砍掉。一旦此產品惹惱了粉絲,一批高管就會離職,而很多員工也要被開。
而在最糟糕的情況下——鑑於風險分析和投資組合優化對於 A 公司的收入舉足輕重,這一失敗最終可能會讓整個公司陷入困境。它可能不會破產,但會失去大部分業務和員工。失敗的 ERP 應用可以讓大公司陷入困境,看看 National Grid US、SuperValu 的衰敗和塔吉特敗走加拿大就知道了。
可能有人會說,A 公司的問題主要在於企業運轉和糟糕的運營思路,而不是資料科學與 AI。
但我並不同意,我認為這次崩潰的核心原因確實來自於對資料科學、機器學習模型與 AI 未來的盲目崇信,同時也包括機器學習群體目前非常普遍的炒作和自我推銷文化。
現在,這個故事還沒有結束:我真誠地希望它能有一個好的結局。A 公司是一個好公司,其員工和客戶都應該獲得更好的結局,但看看現在的情況,一切出現轉機的可能微乎其微,而這種失敗將嚴重地打擊該公司。
參考內容:
https://www.reddit.com/r/MachineLearning/comments/beoxx8/discussion_when_ml_and_data_science_are_the_death/