從試驗品到產品:AutoML是如何一步步貼近產業應用的?

naojiti發表於2019-04-19

今天AI在世界範圍內的發展情況,可以用一路綠燈來形容。國家層面的高度重視與科技巨頭的全力投入齊頭並進,正讓AI如同開了掛一般快速進入產業場景。不知不覺間,工廠裡開始引入了計算機視覺解決方案,電話中與我們對話的客服變成了機器人。

如果說在這樣綠燈全開的情況下,還有什麼在阻礙著AI產業化發展,恐怕就只有知識門檻帶來的AI人才缺失了。根據高盛推出的《全球人工智慧產業分佈報告》:2017年全球AI人才儲備中,中國只佔5%左右。而這些人才大多隻在科技企業間流動,對於傳統行業來說,大多都與AI人才無緣。而AI產業化的物件,恰恰也是這些傳統產業。如何幫助傳統產業突破人才桎梏,降低應用AI技術的門檻,是AI產業化當下重要目標之一。

除了支援AI人才培養之外,我們也一直在嘗試從技術角度解決這一問題,AutoML技術——自動化機器學習就是解決方案之一。簡單來說,AutoML的目標是降低企業使用者、開發者以及研究人員使用AI相關工具和框架的門檻,即使不懂如何搭建神經網路、不懂如何調參,也可以使用AutoML工具搭建出應用級的機器學習模型。

除了谷歌、微軟、亞馬遜這些海外科技企業在AutoML中投入頗多以外,我們也能看到越來越多的中國企業加入了AutoML的隊伍。

從一場競賽,到AI產業化的廣袤沃土

在今年亞太知識發現和資料探勘會議(PAKDD)舉辦的AutoML比賽中,深蘭科技DeepBlueAI團隊從46個國家(地區)的隊伍中脫穎而出,擊敗了微軟亞洲研究院推出的MLintelligence獲得了第一名的成績。

這次DeepBlueAI最大的一個亮點,就是將概念漂移的解決方案引入了AutoML中,所謂概念漂移,指的就是在機器學習中隨著時間推移,目標變數以不可預見的方式發生著變化,導致未來資料分佈與已有資料分佈不一致。也就是說在AutoML快速建立好機器學習模型後,模型的精度是可能隨著時間推移而下降的,這種情況顯然會影響現實場景中AutoML的應用效率。

從試驗品到產品:AutoML是如何一步步貼近產業應用的?

(Feedback phase排行榜)

DeepBlueAI團隊給出的解決方案,是透過融合不同時期的資料以及結合DNN和LightGBM的訓練,加上自適應取樣來緩解類別不平衡,在一定時間間隔中讓模型重複訓練,最終形成對概念漂移的自適應。形成生命力更強、更具持續性的終生自動化機器學習工具。

DeepBlueAI團隊對於概念漂移問題的解決,不僅僅在技術角度具有極高的突破性,在AutoML的產業應用的道路中也給予了很大的推助力。

AutoML面向的物件,大多是對AI技術瞭解不多的企業應用者。這一類應用者顯然不會意識到AutoML中所存在的技術問題,他們很可能會在應用場景出現問題時才發現模型精度產生了變化。DeepBlueAI團隊的解決方案,極大增加了AutoML對於複雜場景的適應性,讓AutoML可以進入金融、營銷、智慧駕駛等等要求更豐富的場景之中,也因此進一步降低了企業應用AI的門檻。

可見DeepBlueAI並不是針對競賽的一份試卷答案,而是真正把目標投向了AI產業化的廣袤沃土。

當AutoML從試驗品走向商品

除了PAKDD的競賽以外,很多科技企業也已經推出了自己的AutoML平臺。例如谷歌推出的針對影像識別的AutoML Vision,以及亞馬遜推出的Amazon SageMaker等等。從AI產業化的命題來說,擁有應用環境自適應能力的這套解決方案會對AutoML造成哪些改變?

首先,深蘭科技可以幫助AutoML真正的去解決更多產業問題。

目前市面上的AutoML平臺,大多隻是試驗性甚至偏娛樂化的,缺乏對於產業應用場景的深入適配,通常只能讓開發者利用模型開發出一些諸如“寵物情緒識別”“桃子甜度識別”等等簡單的模型。

DeepBlueAI團隊意識到了模型精度的變化問題,自然是站在了產業視角看待問題,未來AutoML平臺也將從單純的開發場景逐漸貼近產業場景,更關注模型精度、應用環境等等現實問題。

同時,深蘭科技對AI基礎技術的全面投入可以幫助AutoML進入更多產業領域。

從試驗品到產品:AutoML是如何一步步貼近產業應用的?

除了深度學習框架開發以外,深蘭科技對機器視覺、生物智慧識別、智慧駕駛等等領域都有所投入。針對各種AI技術在自動化過程中,架構組建上的細化差異都有更深入的理解,加之強大的演算法應用化能力,深蘭科技足以讓AutoML從一個面向開發者的工具演變成真正商業化、甚至定製化的企業AI解決方案。

目前深蘭科技的AutoML技術已經廣泛應用在精準營銷、金融風控、自動駕駛、疾病預測等業務場景中,做出了接近甚至超過資料科學家的模型效果,決策精準度超過人類專家數倍。

總的來說,建立在深蘭科技的綜合AI能力之上,AutoML正在從試驗品走向產品,進一步契合產業應用的真實場景。

曙光之前:為什麼中國AI需要腰部力量?

除了AutoML對於當前AI產業化的意義之外,我們更想討論的,是深蘭科技這家企業在PAKDD取得成績更深層的意義。隨著中國AI在世界範圍的競爭力不斷提升,中國團隊在各種學術會議上取得好成績並不是什麼新鮮的事情,為什麼深蘭科技這家企業值得我們投入更多關注?

我們可以看到,深蘭科技身上有兩個明顯的標籤,一個是 “中國自主研發”——深蘭科技與多家國內外知名企業、高等院校以及盧森堡國家實驗室合作,建立聯合實驗室,一直在AI科研上有著諸多投入。另一個是“基礎研究+應用開發”——除了科研以外,深蘭科技已經將技術輸入到智慧駕駛、智慧機器人、AI city等等九大應用領域之中。

兩者結合起來,就是典型的中國AI腰部力量。除了BAT這樣在頭部引領中國AI發展的巨頭,更多的是像深蘭科技這樣,將AI創新能力源源不斷地輸入到細節應用場景之中。

腰部力量對於AutoML的掌握,對於今天我們的AI發展來說至關重要。

從試驗品到產品:AutoML是如何一步步貼近產業應用的?

近年來有一個流傳頗為廣泛的概念叫:AI民主化,指的是讓更多中小企業可以開發出屬於自己的機器學習演算法模型,而AutoML就是符合這一精神的產物之一。隨著AI民主化概念的普及和AutoML技術的日趨成熟,產業中大範圍應用起AutoML工具已經是一種必然。

但從谷歌AutoML的案例中也能發現,伴隨演算法模型訓練工具捆綁銷售的,很可能還有計算晶片或雲端計算服務。一家企業選擇了一個AutoML平臺,同時也意味著將自己的AI技術與平臺背後的企業相繫結。

這時中國AI腰部力量對於AutoML的參與就起了兩個至關重要的作用。

一方面,中國智造可以保證演算法工具以及晶片硬體、雲端計算等等配套服務的自主可控。尤其很多企業的演算法模型會涉及一些商業機密以及敏感資料,如果將這些資料和模型部署到海外企業的雲平臺中,多少會增加一些風險。

另一方面,腰部企業對AI產業化的參與,可以增強行業的多樣性,防止AI產業化被科技巨頭“壟斷”從而促使AI霸權主義的出現。產業在接入AI服務時可以擁有更多選擇,會促進AI領域的發展活力,以良性競爭的模式推動巨頭與腰部企業一同為產業提供更優質的技術服務。

如今在AI賽道上狂奔的跑者們,無一不見到了AI產業化的黎明曙光。在抵達終點的過程中,腰部企業的存在如同一位聯結者,與頭部巨頭們並行向前的同時,不斷招攬著路邊觀望的人,讓他們一同加入佇列,向AI的明天奔去。

AI產業化黎明的到來,或許並不是一條分割兩個世界的終點線,而會降臨於讓更多人參與AI賽道的過程之中。


來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/31561483/viewspace-2642003/,如需轉載,請註明出處,否則將追究法律責任。

相關文章