深度學習框架“國貨”正當時,但要警惕無差別投入的“產業陷阱”

naojiti發表於2020-08-20

最近,美國推動的一系列科技封鎖政策讓人瞠目結舌。我們習以為常的世界科技秩序,毫無疑問正在以肉眼可見的速度被改變甚至重構。

在這樣的話語氛圍下,底層技術自主可控開始成為社會各界的共識與推動方向。而在科技產業程式裡,半導體與計算機作業系統代表著過去有虧欠、今天急於填補的技術門類,也就是我們在今天能夠清晰感受到被“卡脖子”的那些技術。而另一類則是中美大體處在齊頭並進階段,需要積極發展的“未來技術”。所謂昨日因今日果,如果我們不希望未來再次被卡脖子,那麼今天這類技術也必須保持獨立可控,甚至高速發展反超歐美——AI技術就是這個領域的代表。

(去年GitHub就突然限制克里米亞、古巴、朝鮮、伊朗和敘利亞等國家使用者訪問)

在發展AI技術的程式裡,最關鍵的開發底座相信讀者已經很熟悉,那就是深度學習框架。在幾年前,我們就專門討論過深度學習框架獨立自主的戰略意義,今天來看已經一一應驗。而國產深度學習框架發展到今天這個階段,又出現了很多新的動向。在這個階段我們需要的可能就不僅是簡單的中美框架對標與扶持,而是更具有智慧、有策略,有合理產業節奏的方式去推動技術底座良性發展。

在此過程中,盲目執行平均主義的資源分配和產業推動,可能是最大的問題。進入深度學習框架發展新階段,合適的產業策略應該是既期待和推動百花齊放,又能找到成為棟樑之材的佳木。

皆木皆花不是景。只有內在系統完善,發展機制合理的生態系統,才能培育起茁壯的中國AI叢林。

名實陷阱:深度學習框架發展新階段需要警惕什麼?

在產業AI不斷髮展的今天,AI底層技術工具和平臺受到了社會各界,乃至世界各國的普遍重視。但在相關產業成果不斷湧現的過程裡,也勢必因為AI技術是全新事物,缺乏產業通行的判斷標準,導致政府、資本、媒體、產業,各領域的話語表達方式不一致,彼此理解差異很大,這導致後續行動的依據也不同。

舉個例子,眾多技術平臺和工具進入大眾視野,基本都會冠以首個、獨家、突破這類的字眼。搭配上看似強大的資本與團隊背景,很容易讓行業外人士產生過高的心理預期。無論在晶片、作業系統,還是AI、大資料領域,我們已經見過太多類似的問題,甚至鬧劇。這類現象可以稱之為自主科技產業上的“名實陷阱”。

這就像鐵和金都是金屬,但價值顯然不同。但由於大眾層面缺乏對科技產業的專業認知,就很難辨別名稱相近平臺的實際差異。

這一點在深度學習框架的發展中,也已經開始體現。今年以來,不僅谷歌TensorFlow、Facebook的PyTorch、亞馬遜的MXNet三大美國框架不斷更新,國內很多深度學習框架也宣佈向業界開源開放。比如一流科技自研的Oneflow深度學習框架、曠視科技的深度學習框架天元(MegEngine)等等。當然,每個框架背後都充斥著開發者的夢想和心血,也會在一些訓練任務上展現出獨特的優勢。但如果我們橫向對比這些新框架,會發現它們在核心技術、工具完整性、生態佈局上有些參差不齊的缺失,甚至達不到國內老大哥“飛槳”的標準。那麼如果從政策、資本、產業合作等層面都給予同樣的賦能,顯然會造成無差別大水漫灌的問題。

(飛槳全景圖體現了全面的核心技術與完整的工具集)

事實上,到底如何定義什麼是完整的深度學習框架,是一個非常專業化的產業問題。比如早在2018年,阿里開源了旗下的X-Deep Learning,稱其為“業內首個面向高維稀疏資料場景的深度學習開源框架”。而事實上XDL只能面向高維稀疏資料場景這一種需求,能力範圍狹小,很快也就在開發者中不見了蹤影。

同樣的窘境在新近開源的深度學習框架中體現的尤為明顯,像Oneflow這類技術輕騎兵,往往只針對單一的產業需求,會出現能力範圍和工具性、生態性、產業特性的欠缺。而深度學習框架作為AI時代的作業系統,又恰恰是需要聚少成多、長期積累的領域。如果引導產業和開發者無差別入駐,那麼顯然會造成內部凝聚力失衡,無法形成有效生態的問題。

那麼是否有辦法,在產業週期中建立一個關於深度學習框架的判斷機制呢?

三維模型:如何建立AI產業的價值判斷機制?

我們當然不會認為深度學習框架一定就是老的好、新的差,或者強者恆強,大者通吃。也不認為新型深度學習框架就沒有出現的必要,或者缺乏產業機遇。恰恰相反,百花齊放的產業形態是業界開始興旺的表現。只是我們認為無論在產業政策、資本扶持,抑或產業合作上,都應該建立標準化、多元化的價值評判機制,引領深度學習框架向合理性、高效率發展。避免平均主義造成資源浪費,也避免大眾聽到創新和獨立字樣都等而視之,造成公共情緒的錯誤引導。

迴歸到深度學習框架領域,一個健康的價值判斷模型,需要檢測多個維度來審視一款產品或者平臺的發展:

首先,在當前的科研大環境下,核心技術自主權和底層技術自主可控的價值已經非常明顯。政策制定者、產業各界與媒體,應該堅定支援國產框架發展,甚至推動AI產業生態從美國框架向國產框架遷移,畢竟在目前的局勢下,誰也無法判斷下一個斷供的是不是TensorFlow。

然而,僅僅下載使用來支援是不夠的,就像作業系統一樣,深度學習框架本身難度很大,但更具挑戰性的是生態的發展和彙集。相關政策與產業標準,也應該更加關注AI開發者生態,圍繞生態需求制定針對性推動策略。在這方面,一個顯著的指標就是開發者的數目,這能直觀地體現生態繁榮程度,就拿飛槳舉例,它已經凝聚超過210萬開發者,而且正在通過自己的生態化規模將AI能力擴充到各行業,在產業階段,理應得到更高的重視。

最重要的是,深度學習框架要體現出對國家經濟轉型升級的推動力,按現在的政策,就是深度學習框架是否能夠負載今天新基建週期中,產業智慧化帶給深度學習框架的工業級承載需求。這個標準又包含幾個部分,比如核心技術的完整、領先,能夠負載大規模深度學習;另一方面是平臺體系與技術能力對於工業化大生產領域的支撐能力。但大部分的深度學習框架交出來的成績單都還沒達到要求,要麼是覆蓋面狹窄,要麼是企業不滿意。如果向飛槳看齊,它已經覆蓋通訊、電力、城市管理、民生、工業、農業、林業、公益等眾多行業和領域,在疫情期間也落地大顯身手,目前已有9萬家企業通過飛槳建立了超過29.5萬個模型, 這些產業指標,顯然是深度學習框架價值的最好判斷標準,也是後來者亟需突破的方向。

在深度學習框架走向百花齊放的當口,我們希望能夠避免眉毛鬍子一把抓,達成重點分明、產業邏輯清晰的扶持策略與產業引導行為。

產業策略:推動AI底座整體發展的當務之急

對於AI基礎設施來說,百花齊放的產業形態,甚至開發者純粹興趣式的創造都非常具有價值。但如果我們的目標是發展符合社會經濟需求的工業化AI底座,通過新基建推動產業智慧整體發展,那麼就需要制定詳實、完整的產業策略,推動深度學習框架與眾多AI基礎設施一道,向AI工業化大生產發展。在這樣的目標下,有幾件當務之急值得多加重視:

首當其衝的是,重點發展一個體系,有策略進行平臺、資料、開發生態的打通。最佳方案是以發展度最好的深度學習框架為依託,有效整合再創新,與產業溝通,避免重複發明輪子,防止政策扶植、資本、社會輿論的資源錯置或浪費。同時積極推動國產化、自主可控的深度學習框架發展。當然不是說要刻意規避美國優秀技術成果,但在目前階段和國際形勢下,積極推動甚至政策推動深度學習框架國產化、自主化,似乎已經是題中應有之義。

(《新一代人工智慧發展規劃》也提到了扶持深度學習框架的目標)

其次,技術評判標準的建立,是細化核心技術發展目標的關鍵一步。將深度學習框架拆解為更為詳細的產業維度,釐清各平臺的優劣勢與發展所處階段,是目前政府和業界需要共同完成的任務。例如深度學習框架能否保持高頻升級迭代節奏,來解決產業不斷湧現的新問題?核心框架的開發能否變得越來越便捷,讓開發者和企業更容易上手?更別說需要大量具有突破性的新技術,來滿足產業智慧化轉型過程中面臨的門檻與痛點。在這些問題上,飛槳做的比較好,他們具備突出優勢,核心技術發展方向也很明確,可以有效幫助產業快速發展,讓社會資源對平臺的價值判定更具標準化方案。

而且從另一個方向上看,不同的框架處在不同的發展週期,自然也需要不同的發展推動力。比如飛槳在產業核心能力上的特性、開發生態與產業應用上的積累,目前是其他框架所不具備的。建立關鍵技術的評判標準化體系,可以避免“大小班同上”,讓發展領先的深度學習框架向下一個產業階段進行探索,承擔更重的社會價值。

而最關鍵的還是,深度學習框架必須要融入產業生態,建立起對社會經濟的灌溉體系,否則就會為技術而技術,淪為空中樓閣。深度學習框架之所以重要,完全建立在AI技術可以賦能產業,提升社會生產力的基礎上。那麼發展深度學習框架自主化、國產化,也建立在技術平臺與產業需求的高效對接與產業適配上。從這個角度看,在檢驗深度學習框架的價值與發展潛力時,也必須將其與行業結合的案例、效率、平臺可行性納為基礎評判準則。比如說,飛槳推動大工業生產的可行性,正體現在對產業的適配和大量案例上。新冠疫情期間,就有大量AI應用高效產出並在各個防疫領域發揮作用。2月13日,飛槳開源了業內首個口罩人臉檢測及分類模型,隨後,包括中石油、北京地鐵在內的百餘家試用企業紛紛應用落地。

(飛槳開源的口罩人臉檢測及分類模型,助力復工復產)

此外,根據報導,百度與OPPO的合作中,提供了飛槳大規模分散式訓練等技術能力,將OPPO推薦系統業務模型訓練速度提升了8倍,模型擴大了20倍,推薦場景效果提升了4%-5%,節省了90%的記憶體,對於OPPO覆蓋全球3.5億使用者的移動網際網路服務起到了很大助推作用。

還有一個走出國門的案例是,基於飛槳打造的一款無人機自主飛行平臺,已經在東南亞某國提供自主巡邏、火情監測、非法入侵、森林樹木砍伐監測等功能方案,相比人工巡檢效率提高200%,森林覆蓋面積從40%提升到100%,對當地森林防火工作提供了肉眼可見的助益。

在網際網路、科技行業,以及工業、農業、能源、金融,乃至公共衛生與社會服務等領域的廣泛落地,也是市場選擇深度學習框架的一種體現,此前IDC釋出的《中國深度學習平臺市場份額調研》顯示,深度學習市場形成谷歌、Facebook、百度三強態勢,三者佔據了國內超過一半的市場份額,由此可見一斑。從這些角度看,在國產深度學習平臺自主可控創新的最佳契機與平臺化底座的選擇上,飛槳已經建立起了較為明顯的優勢。

當然,這只是對國產深度學習框架主流平臺選擇及扶持的一種思路,這也體現出,在我們重新審視AI產業發展週期與深度學習框架發展賦能時,或許需要更加體系化、生態化、產業指向的目光,來審視不同平臺的差異化戰略價值。

來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/31561483/viewspace-2713451/,如需轉載,請註明出處,否則將追究法律責任。

相關文章