作者:亞馬遜雲科技大中華區雲服務產品管理總經理 顧凡

隨著機器學習不斷向縱深發展,越來越多的傳統企業也開始應用機器學習進行業務創新,實現業務重塑。麥肯錫此前刊發的針對人工智慧對世界經濟的影響專題報告顯示,預計到2030年,人工智慧將為全球經濟貢獻13萬億美元。零售、運輸、物流、製造業和農業等傳統領域在人工智慧和機器學習賦能之後,帶動的經濟貢獻或將遠超軟體和資訊服務業。而且,對比軟體與資訊服務業,這些行業也更需要被賦能,以幫他們更好地部署和使用人工智慧和機器學習。

結合亞馬遜全球20年機器學習的創新實踐,以及亞馬遜雲科技幫助逾10萬客戶在雲上使用機器學習的經驗,我們對傳統企業成功應用機器學習總結了四點建議。

一、制定明確的資料策略

機器學習三要素包括資料、演算法和算力,三者缺一不可。

對於多數行業來說,收集和處理資料是一個難題。因此,企業開始應用機器學習之前,首先需要充分了解自己的資料現狀並制定資料策略。什麼資料現在可用?什麼資料通過一定的工作可以變得簡單易用?如果已經確定幾個想嘗試利用機器學習的場景,就可以採用逆向工作法,根據目標進行倒推,推算出需要的資料、目前已經具備的資料和依然缺失的資料,以及從現在開始需要蒐集的資料。解決了這些問題,制定了明確的資料策略,才會有真實、準備充分的資料去應對基於機器學習的業務創新需求。

部分客戶雖然蒐集了很多資料,但資料的就緒程度較低,資料質量不高。例如,如果感測器送過來的資料有異常值或缺失值,那麼以此為基礎應用機器學習,訓練出來的模型大概率是不夠精準的。

二、從合適的場景切入

企業在應用機器學習的時候往往千頭萬緒,那麼開展機器學習應該從什麼專案切入呢?這裡給大家一個決策參考框架,可以從資料就緒狀態、業務影響和機器學習適用性三個維度進行評估。企業可以選擇資料就緒度高、有業務價值但是業務影響低、機器學習適用性高的應用場景作為機器學習試點和示範專案。

具體從三個方面入手。第一,在開展機器學習的早期階段,公司內部可能對其帶來的作用還有些疑惑,因此需要從一個投入相對小的創新專案開始實驗,它不會影響公司的核心業務,一旦成功可以幫助企業積累經驗,同時贏得內部的信任。

第二,這個專案既需要有業務價值,還要適用於機器學習,取二者的交集。第三,找到一個場景機器學習只是作為輔助去自動化加速工作的某一個環節,而不是替代人。例如,醫生對病人的診斷由非常多的環節組成,其中看心電圖、X光片的過程可以利用機器學習實現自動化,加速醫生的診斷過程,但機器學習不會取代醫生的工作,對治療過程本身帶來的影響比較小,更容易得到醫生的支援和配合。

在成功交付了幾個3到6 個月可以完成的小型專案後,企業就會有足夠的信心和動力去獲得領導團隊的支援,加大機器學習專案投入,逐步應用機器學習來改造核心業務。

以嘉實財富管理有限公司為例,它是嘉實基金旗下的獨立財富管理機構,在全國主要城市均設有財富管理服務中心,2020年為客戶創造回報超過31億元。作為金融企業,嘉實財富以媒體平臺作為切入點,藉助亞馬遜雲科技提供的標準AI 能力,包括開箱即用工具以及機器學習服務平臺上定製的 AI模型,形成了集媒資入庫、語音轉錄、短視訊生成、個性化推薦為一體的媒體處理平臺,讓金融企業有機會將客戶需要的金融視訊,精準的推薦給客戶,從更多的渠道觸達客戶。

三、資料科學家業務化

針對企業成功應用機器學習的第三個建議是要讓資料科學家業務化。以亞馬遜構建機器學習團隊為例,在亞馬遜,我們沒有將資料科學家單獨放到一箇中央團隊,而是將資料科學家與產品、業務團隊放在一起,讓資料科學家業務化。亞馬遜致力於以客戶為中心,我們的機器學習科學家首先要以提高客戶體驗為出發點,而不是從研究機器學習演算法開始。

資料科學家業務化是亞馬遜的重要經驗。我們把這一經驗複製到亞馬遜雲科技的客戶專案中。當客戶缺乏資料科學家時,亞馬遜雲科技的資料科學家和工程師會加入專案團隊,與客戶的業務開發團隊一起工作,凝聚資料科學家和領域專家的力量,為提高客戶體驗而進行創新發明。

傳統企業通常沒有既精通業務又精通機器學習技術的專家和資料科學家,因此也可以把資料科學家/機器學習技術專家與業務領域專家放在一起實現技術創新。山東淄博市熱力集團就成功地通過亞馬遜雲科技的賦能,將其業務領域專家和機器學習技術專家擰成一股繩。淄博熱力利用亞馬遜雲科技豐富的人工智慧和機器學習技術和服務,雙方聯合研發一套基於機器學習的智慧供熱專家系統,根據氣象、SCADA工控資料、建築物維護結構等資訊計算出最佳的供熱模式,並給出具體的操作指令,實現精準供熱,既讓使用者室溫始終保持人體最佳熱舒適溫度,又做到節能增效。

四、應對技能差距

當前,多數企業部署和應用機器學習最大的瓶頸之一是機器學習人才的缺口。新興公司爭搶機器學習人才,同時各類傳統企業也需要機器學習人才。在這種情況下,企業尋找能夠對其提供幫助、為企業賦能的服務商是解決這一問題的最佳途徑。

我們在與行業客戶交流中發現,很多行業問題需要對演算法進行大量的迭代和優化,不斷提高精準度。一些行業難題,甚至需要研究新的演算法進行破解。面對這些複雜的行業問題,不能停留在只教會客戶使用工具上。亞馬遜雲科技的做法是“扶上馬、送一程”。我們集合瞭解決方案架構師、人工智慧實驗室、資料實驗室、快速開發團隊和專業服務團隊,根據客戶的專案需要,參與到專案的生命週期當中,與客戶共同尋找適用於機器學習的業務場景,跟業務人員、技術人員在一起開發出產品原型,然後快速迭代進行實施。讓客戶以儘可能小的試錯成本完成產品原型開發,彌補客戶的技能差距。

通過這樣的方式,我們授人以漁,賦能客戶創新,並且一直堅持平臺思維,讓更多的人使用亞馬遜雲科技進行創造和發明,讓人工智慧和機器學習普惠。亞馬遜創始人傑夫•貝佐斯說過,創新有多種形式和各種規模,最激進和最具變革的創新是幫助他人釋放創造力,實現其夢想。

亞馬遜雲科技的一大核心目標,就是將機器學習能力交付至每一位開發人員手中。藉助Amazon SageMaker能夠幫助客戶快速構建、訓練以及部署機器學習模型的能力,我們得以更進一步,將機器學習能力交付至更多希望基於機器學習創新的使用者手中。

總之,企業客戶應用機器學習大有可為,建議企業制定好明確的資料策略,尋找適合機器學習的應用場景作為切入點,先突破創新業務,再改造核心業務。同時讓資料科學家深入業務,避免閉門造車。希望越來越多的企業通過機器學習實現不斷創新和發展,在激烈的競爭之中立於不敗之地。