AI面臨產業大考:落地雖難,但產業化路徑已日漸清晰

naojiti發表於2021-01-05

今天我們談論AI,已經很少再提及下圍棋、打遊戲等“碾壓人類”式的炸裂新聞,而是更關注AI如何與各行業相結合,創造真實的產業價值與經濟效率。

近期,國際諮詢公司Gartner 將“AI工程化”列為2021年度九大技術趨勢之一,這也是繼去年“AI民主化”入榜後,Gartner再次對AI技術做出預判。

作為AI 民主化技術趨勢報告的主筆分析師,Gartner高階研究總監呂俊寬認為:這兩大趨勢的核心都是讓AI逐步走向產業。從案例式的單點專案,到千行萬業的規模應用,AI走向產業其實包含了兩層含義:一是AI可以用規模化生產的方式來降低產業使用門檻,使技術成本可接受,即“AI民主化”;二是AI可以與具體的產業場景相融合,達成可靠、可見、可信的良性收益,即“AI工程化”。

但對於大部分人和企業來說,“未來所有公司都是AI公司”的願景並不容易實現,從“技術概念”到產業落地,中間還橫亙著廣袤而空曠的未知地帶。

今天,大家都希望AI會如同“水電煤”一樣推動第四次工業革命來到我們身邊,但真正惠及所有企業,讓各行業都能加上AI這個核心,仍舊任重而道遠。

自2018年初,Google釋出Cloud AutoML至今,AutoML成為了微軟、Facebook、AWS、BAT等巨頭爭相佈局的重心,Gartner同時也將AutoML看做是AI產業化程式中不可或缺的關鍵要素。AutoML因何成為了巨頭們的“新寵”,它又在推動“AI民主化”和“AI工程化”中充當了什麼角色?

AI落地難成共識但產業化之路已日漸清晰

今天,AI為各行各業帶來了效率提升、價值增長,讓所有人都看到了AI的價值和潛力。伴隨著AI技術的日臻成熟,AI正在快速進入“工業化”階段。但人才缺失、實施複雜、週期過長、成果過高等客觀因素,也造成了AI難產的局面。

想讓AI真正的釋放價值,或許可以從煤的發展歷程中看出端倪。

19世紀,憑藉煤炭能源的挖掘,英國迅速創造了一個令世界瞠目結舌的工業社會,一躍成為世界霸主。除了儲煤量大以外,其中最關鍵便是實現了煤產業化。

具體表現為三點:

1.提升了應用效率:蒸汽機等高效率工具的發明與普及,讓煤這一能源得以高效、規模化的應用。

2.完善的基礎設施:鐵路、運河等的建設,讓煤炭能夠從礦區被運往更具商業價值的產業帶。

3.打造產業帶:人才、工具、市場,緊密結合在技術半徑內,形成產業帶,讓高效生產成為可能。

正是這些鋪陳,才讓煤得以真正成為工業革命中“動力和文明”(艾默生語)的象徵。

如今,AI正有機會像煤一樣,給人類社會帶來天翻地覆的變化,這就讓AI滿足全社會規模化應用的能力,變得格外重要。在這一過程中,同樣少不了“蒸汽機”、“鐵軌”和產業帶。

AutoML讓AI價值躍點

在瓦特改造蒸汽機之前,英國煤礦普遍使用的是紐科門蒸汽機,需要消耗大量的煤來維持運轉,也讓礦區工人們不得不在嚴酷的環境中工作。改造後,新的蒸汽能效提升了四倍之多,從而讓煤進入了高效利用時代,也讓筋疲力盡的體力勞動者們得到了解脫。

AutoML的價值與蒸汽機一樣。在最新發布的《AI for Everyone——AutoML 引領AI民主化之路》白皮書中,Gartner將其視為降低門檻、提升效率的利器。

簡單來說,AutoML(自動機器學習)就是可以讓企業或個人不用寫一行程式碼,就訓練出一個企業級的機器學習模型的技術。只需要按照說明,把訓練資料都拖進AutoML系統裡面,很快一個適用於自身應用的機器學習模型就訓練好了。讓機器學習中最耗時和最難的工作——資料清洗、特徵工程,變得輕鬆不少,甚至無需考慮瞭解AI複雜的原理。

對於渴望規模化、高效率應用AI的企業來說,這意味著不需要從源頭去設計一個神經網路或是進行復雜的調參,最大程度地降低了機器學習的程式設計工作量,節約了AI開發時間;同時也意味著對專業資料科學家和演算法工程師的依賴程度也有所降低,緩解與科技巨頭“搶人才”的困擾。在自動駕駛、金融風控、工業製造等多個領域中,使用AutoML搭建的模型效果甚至超越了大多數演算法工程師。

於是,我們看到了越多越多的企業和開發者加入到了AI產業化的行列中,以百度為例,其EasyDL已擁有70多萬開發者,覆蓋了20多個場景。更為欣喜的是,我們看到了沒有一點AI甚至是程式設計背景的人將AI物盡其用:婦產醫院的醫生基於AI獨角獸第四正規化的AutoML技術及產品,建立了新生兒體重預測和胎膜早破的預測模型,為產婦生產方案的制定提供更多依據,這在學術界首次證明了大氣壓與胎膜早破之間的緊密相關性,填補了這一領域的空白。

這些案例意味著AI開始進入低門檻、低成本、泛用性的工業生產階段,得以快速落地企業,釋放技術價值。

據Gartner的預測,2023年,40%的開發團隊會使用自動化機器學習服務來構建為其應用軟體新增AI功能的模型,而2019年這一比例不到2%。到2025年,AI將使50%的資料科學家活動實現自動化,從而緩解人才嚴重短缺問題。

這也是為什麼,Gartner 認為AutoML是引領AI民主化,實現“AI for Everyone”的關鍵力量。

鋪設鐵軌:通往產業智慧的通衢

AutoML提升了AI的效能,但智慧怎麼才能夠抵達產業端,卻是一個大問題。因此也吸引了不少巨頭和創業公司爭相佈局,它們的存在就像是鐵軌與運河,將源源不斷的技術能量運輸到產業土壤中去。

目前來看,AutoML平臺主要分為以下幾大類:

第一種,以谷歌、微軟、亞馬遜、百度等為代表的頭部AI巨頭,具有較強的AI實力,可以提供從演算法到流程全自動化的工具支援。

第二種,是一些開源技術平臺或組織。優勢是靈活、開放,比如在谷歌釋出AutoML之前,2013年就出現了可以自動選擇模型並選擇超引數的AutoWEKA。

第三種則是一些技術/演算法公司,除了AutoML工具之外,還會面向企業提供資料策略、業務諮詢等服務。

那麼,它們都在向產業界提供哪些具體能力呢?

首先是平臺和工具。比如谷歌推出的Google Cloud AutoML覆蓋了影像分類,文字分類以及機器翻譯領域,比如使用者只需要上傳圖片到AutoML Vision上,就可以訓練和部署一個計算機視覺模型。今年還展示了能夠自動建立計算機視覺系統NASNet的能力,可以幫助自動駕駛或智慧機器人開發。

微軟差不多和谷歌同時期釋出了自己的AutoML平臺,涵蓋影像、影片、文字和語音等各個領域。

國內比較領先的如百度的EasyDL,使用者可以在上面開展影像分類、物體檢測、影像分割、文字分類、影片分類、聲音分類等任務。代表廠商第四正規化,打造的自動化機器學習平臺Sage Hypercycle ML,也面向金融、零售、醫療、製造、能源等行業提供了多種封裝好的AutoML演算法及全流程開發工具。

其次是服務和定製。近兩年來,AutoML領域也越來越注重定製化服務。比如今年1月,微軟就針對視覺能力打造了自動化平臺Microsoft Custom Vision Services(微軟定製視覺服務)。谷歌也與產業端合作,利用谷歌雲的AutoML Vision技術建立了能理解古埃及文字的工具Fabricius,來達到普及AI的效果。國內如第四正規化也提出了“AutoML全棧演算法”從感知、認知、決策三個關鍵維度幫助企業提升關鍵場景的決策水平,同時針對不同行業、不同技術能力的企業來有的放矢地提供服務。

如果說AutoML平臺和工具降低了AI的應用門檻,加速了“AI民主化”的程式,那麼服務導向的出現,則讓人們看到“AI工程化”趨勢的端倪。

這一變化背後的原因也很簡單,回到第一次工業革命時期,我們會發現基礎設施的鋪設往往需要因地制宜,以龐大的工程將運河與鐵軌不斷延伸到東海岸。AI落地產業自然也不是一種平臺或工具集就能夠完成的。

一方面,許多巨頭雲廠商在推出AutoML平臺的同時,也希望企業使用者與自己的開發生態相捆綁,比如谷歌就要求必須在谷歌雲上部署相關模型和網路,這對於無法或無意使用谷歌雲的使用者來說就成了限制。

同時,應用AI更是一個千變萬化的複雜工程。要讓毫無機器學習經驗的個人和企業藉助AutoML用上AI,需要與產業應用場景的深度適配,同時解決資料收集、資料清理、打通資料孤島等等障礙,才能讓AI在業務端跑起來。這些都需要懂業務的行業人士和演算法人員來共同探討、磨合,去建立符合產業需求的技術管道。

只有一個充分考慮不同產業地帶客觀環境與具體訴求的“交通網路”,才能驅動AI正在走到產業那邊去。

靠近價值:AutoML產業帶的興起

對於企業來說,應該如何考量和適時使用AutoML來提升“AI產能”呢?

從企業視角出發,我們認為有三個關鍵要素是需要注意的:

1.是否具有AutoML落地的配套服務能力。

每個廠商期待的自動化、智慧化是不一樣的,企業在選擇AutoML平臺時需要考察其服務能力與背景。

呂俊寬認為,對於企業來說,如何幫助自己提高業務價值是關鍵,但不是每家企業都能像網際網路巨頭一樣能夠讓AI與業務深度耦合,所以需要AI廠商有強大的服務能力支撐企業客戶兌現AI的價值。對於AI企業來說,想要服務好企業,對產業服務的重視會直接決定其技術上的投入程度,對產業迫切需要的能力亦需要快速迭代;同時應當深入瞭解客戶的業務場景,幫助其提升關鍵的業務指標和表現。有的業務適合上雲、有的適合產品化服務,AI規模化應用後如何解決計算成本上升問題,是否需要自建AI系統等等,這些需要在不同選項裡找到平衡點。

Gartner的AutoML白皮書也指出,頂尖的AutoML演算法相當於AI應用構建的“引擎”。而AI應用的開發是一項非常複雜的精細化工程,涉及諸多環節。假如沒有一套完整的AI開發工具,各個環節就會變成彼此割裂、互不相容的“孤島”,不僅導致科學家在開發過程中疲於奔命,也會讓AI規模化變成“泡影”。只有打造基於AutoML演算法“引擎”的“自動化工廠”,實現全面產品化,才能真正推動AI產業化落地。

擅長於個人C端市場的谷歌在AutoML上的投入程度和研發頻率相對於其他子業務(如DeepMind)就要少的多,更重視極客和工程師思維;國內如百度在推廣EasyDL時,也十分重視對開發者和企業的幫助,和服務體系的打造,支援初中生、中年個體戶、電網企業等零門檻用上AI;第四正規化的策略則更加細緻,根據不同技術成熟度的企業,提供不同應用的AI產品和方法論,讓AI產品得以更好使用和落地。例如,面對想要快速驗證AI效果、快速落地的客戶,可以選擇Sage HyperCycle ML,某金融企業就用這種方式讓毫無AI模型構建經驗的金融企業在幾小時內完成建模工作;而面對體量大、場景多的客戶,第四正規化也可透過先知等平臺化產品,讓客戶自主、規模化、低門檻落地AI應用,同時,也嵌入了相應的AI服務支撐體系。

2.如何以較低的成本得到較好的效果。

如果說“AI民主化”是讓更多人瞭解和感受到AI和AutoML能做什麼,那麼“AI工程化”則要求AI規模化落地的同時,還能夠帶來更系統性的業務價值。

第四正規化副總裁、主任科學家塗威威告訴我們,企業在使用AutoML時有三個考量點:業務收益和效果、成本支出、解決問題的範圍,只有這三點都滿足企業端的要求,才能讓AutoML切實有效地幫助AI加速規模化應用程式。

比如演算法上需要提升效果,給業務帶來實際增長點,讓模型面對各種真實複雜情況都能快速識別,而非只是停留在實驗室階段;

許多企業也會面臨一個問題,就是線上下效果好,而部署到真實環境中,效果大打折扣。這就需要注重線上線下資料一致性的問題,並做出相應的最佳化;

成本方面,AI如何跟現有業務結合、如何部署到環境中去,計算資源怎麼解決,都是需要去考慮的。AutoML在幫助AI規模化落地的同時,也帶來了巨大的算力消耗,如果採用業界常用的GPU甚至是TPU,絕大多數的企業都是負擔不起的。因此,為了讓AI更好的規模化,還需要軟硬體協同最佳化,讓部署AI的成本變成“可負擔”。

3.是否具有擴充套件性。

我們知道,技術產品和架構總是會不斷迭代更新的,如果需要全盤推倒重來,無疑會給企業帶來沒有必要的損失,這也讓很多企業對AutoML等新型生產力工具望而卻步。

這就需要AutoML平臺和廠商在一開始就考慮到技術的擴充套件性並進行應對。

比如百度EasyDL就藉助百度大腦的全棧AI能力實現底層技術的全面部署與融合;第四正規化透過技術解決模型的自學習問題,讓動態模型可以根據業務變化而進化,進行自動化迭代。同時,第四正規化還將AutoML相關架構、技術抽象成了作業系統,這就從底層核心將技術框架穩定下來,讓各項資料和應用可以被標準化管理,後續運維也可以透過系統層來應對變化,從而讓企業可以建立更長期的AI戰略,不會因為技術變化而讓業務受到波動。

當企業、技術、平臺等等都匯聚在一起,形成了完整的AutoML產業帶,生態也就開始真正建立起來,最終拉開一個恢弘的產業智慧時代大幕。

從這一刻,寫下未來

如果說是煤工業的崛起,帶領人類穿越了漫長的工業童年時代,開始了一個史無前例的時代,那麼隨著國家戰略的推動和產業需求的全面爆發,AutoML帶來的產業智慧紅利是否會像煤炭一樣,引發一場新的產業革命?

AI的產業大考暴露了人才短缺、成本高昂等問題,又推動了AutoML這樣解決方法的產生,由此帶來的AI民主化和工程化浪潮,正在將全社會帶入智慧變革的疆域。

其中最值得注目的,是中國企業表現出了對科技前所未有的飢餓感,依靠技術來找尋業務增長點,急切地尋找技術場景和落地,這些積極的做法都讓AI的紅利更早、更快地生長在這片土地上。

來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/31561483/viewspace-2747674/,如需轉載,請註明出處,否則將追究法律責任。

相關文章