工業革命的秋之漣漪(一):百度飛槳&AI引擎

naojiti發表於2019-10-16

18世紀中後期,人類推開了工業革命的大門。

在此後的近250年裡,世界經濟迎來了從未有過的發展曲線,漫長的中古時期轟然倒塌,現代化的晨曦點燃了文明之光。

此後的歲月裡,每當經濟發展遇到瓶頸,社會問題凸顯,新的工業革命總會適時出現。從蒸汽革命、電氣革命,到資訊革命,人類已經完成了三輪奇蹟般的生產力增長。

那麼,第四次呢?它將出現在何時,以何種技術作為主軸,又如何一步步改變我們的社會經濟?毫無疑問,回答這些問題在這個時代無比重要。

幸運的是,網際網路、雲端計算、大資料,再到AI的一系列發展,基本已經讓第四次工業革命的首要問題產生了共識:這次全球行動註定由智慧化來指揮,以深度學習為代表的第三次AI崛起,將為各行業生產力再次飛躍提供原動力。

而與前三次工業革命不同,即將迎來的智慧革命中,中國首次與世界站上了同一起點。

那麼接下來的問題,是產業智慧革命從理論可行到實際發展,如何一步步填補AI與現實生產力間的縫隙。這個10月,作為中國唯一功能完備的深度學習開源平臺,百度飛槳將迎來一系列走入工業化生產與現實世界的大事件。我們發現,沿著飛槳落地的腳步,恰好可以完整描述出從AI技術,到可用平臺,再到產業實踐與經濟矩陣,深度學習一步步擴散到現實世界中的行為邏輯。

如果說,得出AI與產業結合的可能性,是智慧革命的春芽;那麼收穫AI滲透現實的真實路徑,就是這場智慧革命的秋實。恰好時至華夏大地滿眼秋色,我們希望用一個系列,來追尋從飛槳蛻變,到第四次工業革命的先聲。從深度學習的一粒石子,到產業與國民經濟的層層波瀾,改變正在這個秋天層層震盪開去——也許可以稱之為,工業革命的秋之漣漪。

第一層的故事,關於飛槳產業級深度學習開源開放平臺。10月16日,首屆世界科技與發展論壇在北京舉辦,面對著現場來自全球20多個國家和地區的200多名院士、諾貝爾獎獲得者、世界重要科技組織會員、大學校長和企業家,百度CTO王海峰釋出“飛槳產業級深度學習開源開放平臺”,智慧時代的作業系統,再次得以升級。

這件事改變了什麼?讓我們先從一切故事的背景說起:產業智慧化的沃土,我們的中國。

一片土地的期望

工業革命是需要溫床的,18世紀完成土地和宗教改革的英倫半島,19世紀急需全球化經濟的歐洲大陸,20世紀在矽晶片上孕育新時代的美利堅。必須有技術底座和強烈需求,才能孕育工業革命的動力和舞臺。

而今天的中國,廣泛的產業升級需求和供給側改革,構築了充分的工業革命需求;而網際網路的長足發展,資料與計算底層設施的建造,則為智慧技術提供了生長溫床。二者相加,最適合AI技術投入產業應用,同時也是最需要AI技術完成生產力迭代的地方,都變成了中國。

智慧革命發生於中國,是三種情況的交匯。首先網際網路的長足發展,醞釀了人才與技術的底座,這股力量需要被引導向產業智慧的新藍海;其次,中國的產業結構完整而廣泛,各行業或多或少都蘊藏了可以被AI技術完成“提質增效”的空間。在中美科技齊頭髮展的國際新局勢下,國家經濟整體對AI技術應用具有深層渴望。一系列需求構成了產業智慧化命題最大的市場空間;同時需要看到的是,中國數字化滲透度不如已開發國家,各產業的經濟發展週期、人才儲備情況、數字化水平參差不齊,這讓AI深入產業充滿了具體性與不確定性。AI基礎平臺與行業智慧的交融有待進一步探索。

全球前列的技術水準、廣泛龐大的市場需求、複雜具體的行業挑戰,這三者共同構成了這片土地與AI技術相遇時驚喜與困難並存的現狀。雖然廣義的前景無限光明,但當智慧革命深入某個具體行業時,問題往往層出不窮。以深度學習為代表的第三代AI技術,與以往軟體應用不同的地方在於,它以機器學習和神經網路為基礎特徵,需要經歷開發、訓練、推理部署,最終走向產業應用。但這整套流程對於垂直行業來說,每個步驟都充斥著挑戰:

1、AI模型的開發效率低、開發成本大,人才難以尋找。

2、能夠支撐產業級別的AI訓練,需要龐大算力和巨大的資料量,以及精度保障能力。這個環節往往是企業的最大負擔。

3、模型在推理端的高時延、高能耗、低速度,容易造成AI應用不達標,形成臨門一腳的失誤。

4、千差萬別的行業需求和應用特徵,對AI技術的標準化、模組化、行業智慧結合提出了廣泛挑戰。

綜合起來看,中國引領第四次工業革命,在今天希望巨大同時挑戰巨大。解決這些問題,有很多種思路。但有一個邏輯是無可否認的:今天開發深度學習模型,需要開發框架的支援;未來的產業智慧應用,需要高度可用的作業系統作為底層算力、演算法與行業應用的中介軟體——無論是今天還是未來,飛槳的戰略價值都與中國的期待緊密相連。

一座車站

在討論飛槳的價值生長時,我們必須要注意產業節奏的變化。

深度學習模型的開發,需要以開發框架作為基礎工具,這在今天已經成為了常識。支援高併發訓練部署的完整框架,是飛槳誕生時的價值指向,這時它是AI開發者的一種選擇;隨著產業智慧化不斷加深,國民經濟應用AI的需求加強,自主可控變成了安全前提,這就讓飛槳這個中國唯一功能完備開源平臺的戰略價值順勢凸顯;接下來,佔據了關鍵位置的飛槳,可用向上向下生長出更多演算法、工具與解決方案優勢,成為儘可能容納開發、訓練、部署週期,一站式解決AI應用困境的作業系統。

這個邏輯就像車站。當鐵路貫通時,車站是必需品。而當中國AI的鐵軌上,只有飛槳一座車站時,這座車站可以進一步擴容功能,為旅客提供儘可能多的服務。我們知道很多車站成長為了商業綜合體,就是這個邏輯。

在王海峰釋出的飛槳全景圖中,我們可以看到飛槳的目標,是打造一個向下抵達晶片層、向下輸出到應用層,容納其中所有的開發支援與產業應用需求,從而打造標準化、模組化、自動化的AI入口。這就像智慧手機時代,開發者只需要學習安卓/IOS,再懂基礎的標準語言就可以進行開發。AI時代想要真正到來,同樣需要一套類似邏輯的作業系統——這就是飛槳的發展軌跡。

目前,飛槳已經形成了體系完善、工具豐富的開發平臺生態。在核心框架層面,提供開發、訓練和預測一整套的技術能力;在此之上,官方支援包括自然語言處理、視覺、推薦和語音等在內的豐富的工業級模型庫,以及支援語義理解、目標監測、影象分割等任務的端到端開發套件。工具和服務平臺層面,提供自動化深度學習、遷移學習、強化學習、多工學習等工具元件和EasyDL、AI Studio等降低技術門檻的服務平臺。最終形成了集深度學習訓練和預測框架、模型庫、開發套件、工具元件和服務平臺等為一體,功能完備、全面開源開放的產業級深度學習平臺。

當深度學習的水滴投入現實世界,飛槳是它激起的第一層波瀾。我們可能需要追尋的,就是這層漣漪如何向更遠處蔓延。其實答案已經顯露,王海峰對飛槳的最新定義,是產業級級深度學習開源開放平臺——顯然,這裡的關鍵點是“產業級”三個字。

這三個字代表了飛槳接下來的發展方向。一座車站,可能生長出一個商業綜合體。接下來,更可能誕生一座城市,美國的奧爾良、芝加哥;中國的鄭州、石家莊莫不如此。飛槳之城,就建立在第四次工業革命的中國底座中。

一條線

或許很多朋友,覺得“產業級”無非就是一個修飾。但是百度技術體系向來是不會隨便新增修飾詞的。相反,他們更喜歡把重要的技術更新,輕描淡寫地說出來。

想要理解飛槳的“產業級”蛻變,需要知道機械學中有個概念叫做“工業紅線”。我們自己在家也可以DIY一個發電機或者蒸汽機,實驗室裡可以製造機器複雜的機械裝置,但是這些裝置都無法投入工業應用,就是因為他們無法越過“工業紅線”。

一種技術和裝置,想要達到工業標準,需要滿足一系列條件:成本控制、使用難度控制、生產效率達標、模組化元件、大規模生產支撐等等。所以產業工業化必須是一套完整的體系相互支撐,任何一個創新點如何達不到標準,都可能摧毀整個產業鏈的效率。

在今天,企業知道AI好用卻無法用,所有困難本質上都因為AI相關工具和平臺,無法達到切合產業生產需求的工業級標準。夠快、夠大、夠簡單,這些聽起來簡單的話題,其實是極其困難的部分。

而飛槳加上“產業級”,就是百度決定闖過這條工業紅線的標誌。具體來說,飛槳踏過產業級紅線,來自於四個方面國際領先技術的突破:

1、人才線

想要挺進工業生產,我們就不能假定每個行業的AI開發者和技術人員都是天才大神。然而工業級的深度學習模型卻在持續複雜化,程式碼結構的理解難度不斷提升。這給開發人員帶來的巨大挑戰。

想要AI走進產業,就必須讓開發簡單易懂,與如今同行的程式設計教育和行業並軌。為此,飛槳完成了基於程式設計邏輯的深度學習框架技術,同時支援宣告式和指令式程式設計,兼具開發靈活性和穩定性。也就是說,如今的程式設計從業者可以不經歷漫長學習就能使用飛槳,企業的AI人才門檻也將極大降低。

2、訓練線

工業級AI的基礎特徵,就是訓練所用的資料和算力異常巨大,尤其是大規模個性化推進場景,需要超大規模的稀疏性特徵訓練,堪稱AI中的重工業。再精巧是演算法和工具,如果適配超大規模訓練都沒有意義。踏過訓練線,是AI作業系統駛向未來的核心。

為此,飛槳平臺率先突破了超大規模深度學習模型訓練技術,實現了世界首個支援千億特徵、萬億引數、數百節點的開源大規模訓練平臺,攻克了超大規模深度學習模型的線上學習難題,實現了萬億規模引數模型的實時更新。這就像工業領域的超大熔爐和巨型鍛造機,為未來更復雜的產業需求打造平臺底座。

3、硬體線

AI駛向工業革命,一個基本邏輯就是需要把深度學習技術與現實中的無數裝置相結合,並且相容複雜的異構算力、差異化平臺,組成能夠適應行業需求的解決方案。引申到作業系統中,這就需要技術中間層提供端到端部署的部署能力,實現軟硬體一體優化。

這個領域,飛槳為產業世界提供多端多平臺部署的高效能推理引擎。在推理方面,飛槳平臺不僅可以和其他開源框架訓練的模型無縫銜接,還可以輕鬆的部署到X86 CPU、ARM CPU、Nividia GPU、Mali GPU等不同架構的平臺裝置上。同時提供領先的推理速度。經過跟華為麒麟NPU的軟硬一體優化,使得在NPU上的推理速度進一步突破。

4、演算法線

最後到應用層,工業領域所需要的深度學習演算法,往往以超高效率、多模態為主要特徵。這類演算法的開發訓練難度不低,企業往往無法自行研發。為了讓工業級的AI演算法普惠行業,飛槳提供面向產業應用的跨模態通用語義表示技術,開源開放覆蓋多領域的工業級模型庫。

截至目前,飛槳平臺支援80多個產業實踐中長期總結和打磨的主流模型,同時開源開放100多個預訓練模型,搭配大量工具和服務層的能力,構成適合產業應用的演算法+工具+服務綜合工具箱。

每一條必須要跑過的路,飛槳都願意和有能力比國際競品多跑一段距離。累計起來,構成了世界AI框架領域,唯一的“工業過線者”。

產業級,三個筆畫簡單的字裡,孕育了多個領域對已極限的突破,對未知世界的憧憬和洞察。

一圈漣漪

目前,飛槳深度學習平臺的開源開放,已累計服務了150多萬開發者,擁有超過6.5萬企業使用者、在定製化訓練平臺上釋出了16.9萬個模型,真實推動了中國AI技術的標準化、自動化和模組化,加快產業應用步伐。

在從深度學習到產業級開發平臺的第一層漣漪之後,飛槳的能量震盪到廣袤的產業世界與開發者群落,形成了第二層堅強有力的漣漪。

在接下來的第二篇裡,我們將追溯工業革命的漣漪——飛槳向產業實踐和開發者群落中的投射與嘗試。

各行業的案例、大量真實場景的凝結、實踐中的問題與解答,都在飛槳與這個秋天的相遇和成長。

作為產業AI引擎的飛槳,要在颯颯風聲中,讓世界聽到它的轟鳴聲。

來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/31561483/viewspace-2660283/,如需轉載,請註明出處,否則將追究法律責任。

相關文章