飛天 AI 平臺重磅釋出!阿里擁抱 AI 這五年

dicksonjyl560101發表於2019-09-26

2014 年,一個名為“iDST”的神祕部門的誕生開啟了阿里的人工智慧新徵程,5 年後,初長成的達摩院成為了阿里 AI 崛起的代表性力量。如今,阿里已躋身全球人工智慧技術研發的第一梯隊,成為時下這 AI 技術洪流中不可或缺的力量。這份出彩的“成績單”背後,是阿里 AI 團隊過去 5 年的籌謀、堅守與突破。

9 月 25 日 -9 月 27 日,阿里巴巴雲棲大會在杭州召開。在本次大會上,AI 悄然佔據 C 位,新任“阿里雲智慧計算平臺掌門人”賈揚清、阿里巴巴達摩院機器智慧實驗室負責人金榕、阿里巴巴達摩院語音實驗室負責人鄢志傑等三十幾位達摩院技術專家在大會第二天釋出了阿里在 AI 領域的最新研究進展和成果。AI 前線提前與賈揚清、金榕和鄢志傑三位專家展開了對話,藉此機會對阿里 AI 佈局和技術實力做一次全面解讀。

飛天 AI 平臺首次亮相

阿里的 AI 能力再上新臺階。在雲棲大會第二天,新任“阿里雲智慧計算平臺掌門人”、阿里巴巴集團副總裁、阿里雲智慧計算平臺事業部總裁賈揚清正式對外發布飛天 AI 平臺。

飛天 AI 平臺是賈揚清入職阿里巴巴後首次釋出的機器智慧產品。採訪中,賈揚清向 AI 前線展示了飛天 AI 平臺的“硬”實力。

飛天 AI 平臺到底是什麼?

我們先聽一下賈揚清的定義:“這次釋出的飛天 AI 平臺,不僅是阿里 AI 整體能力的結構化展示,更是一個開發者更易觸達的 AI 平臺,開發者在飛天 AI 平臺上,可按需呼叫平臺的能力,無論是軟硬體一體的程式設計環境,還是雲邊端一體的高效能訓練和推理引擎;無論是阿里雲已經開源的能力,還是成熟的商業版服務。”賈揚清表示,“這些都會讓開發者擁有更多自主可控的技術路線、同時擁有更加強大的 AI 能力”。

據瞭解,飛天 AI 平臺主要包含兩層:高效能訓練與推理引擎框架,多模態演算法開發與部署平臺。

飛天AI平臺重磅釋出!阿里擁抱AI這五年

框架層面:飛天 AI 平臺包含 Alink(FlinkML)、MNN(輕量級深度學習端側推理引擎)、XDL(面向高維稀疏資料場景的深度學習開源框架)、SQLFLOW、PAI TensorFlow(阿里雲優化的商業版 TensorFlow)、PAI Blade(編譯優化)、Elastic DL 等;

效能層面:

  • 飛天 AI 平臺通過資源排程能力優化,可提升 30%GPU 叢集利用率;

飛天AI平臺重磅釋出!阿里擁抱AI這五年

  • 在大規模稀疏模型訓練場景下,相同資源最高提升 7 倍效能;

飛天AI平臺重磅釋出!阿里擁抱AI這五年

  • 接近理論的線性的分散式訓練擴充套件能力;

飛天AI平臺重磅釋出!阿里擁抱AI這五年

  • 以及普惠的系統自動編譯優化能力。

飛天AI平臺重磅釋出!阿里擁抱AI這五年

AI 開發與部署平臺層面:飛天 AI 平臺是一個自帶最佳實踐的互動式 AI 開發平臺,他將 AI 程式設計系統和大資料程式設計系統有機結合,在開發者實際操作過程中,不同崗位、不同技術背景的工程師之間往往有設計理念及技術實現細節上的差異,隨著業務複雜度、技術複雜度的增加,這種差異帶來的影響被進一步放大。飛天 AI 平臺經過多年的沉澱、打磨,在阿里巴巴集團及阿里雲業務的實踐中,積累了一整套“歷經實戰演練”的資料處理、特徵工程、演算法、評測元件,並以模組化的方式通過統一的 AI 開發環境提供標準服務,解決實際業務問題。

  • 開發者一站式拉起的輕量級 AI 開發平臺

飛天AI平臺重磅釋出!阿里擁抱AI這五年

  • 資料科學家更加喜愛的大資料和 AI 協同開發平臺(全新功能)

飛天AI平臺重磅釋出!阿里擁抱AI這五年

  • AI 推理服務平臺。

飛天AI平臺重磅釋出!阿里擁抱AI這五年

賈揚清表示,與目前市場上的 AI 平臺相比,阿里飛天 AI 平臺最大的不同點在於它是阿里自己在用的 AI 平臺,如電商搜尋、個性化推薦、廣告、智慧語音客服、無人駕駛、城市大腦等,都是在飛天 AI 平臺上開發出來的,這也是飛天 AI 平臺“學以致用”的最佳體現。

此外,飛天 AI 平臺與它的“孿生兄弟”飛天大資料平臺緊密結合,形成了飛天 AI 平臺的一大特色。大家都知道大資料技術是 AI 發展的重要基礎,而在今年 9 月,飛天大資料平臺的自研大資料計算平臺 MaxCompute 和開源大資料計算平臺 E-MapReduce 分別在 TPCx-BB 和 TPC-DS,首次將資料集規模擴充至 100PB,並在 30TB 資料規模排名中雙獲第一。放眼市場,能夠將大資料和 AI 技術完整結合,並取得如此成績的平臺可能只有阿里一家。在賈揚清看來, 在 AI 更廣泛落地的大背景下,單純用一個深度學習平臺或框架做計算是不夠的,一定要跟大資料平臺緊密結合。

賈揚清強調,作為一個平臺,飛天 AI 平臺所提供的能力是讓開發者能夠利用這些能力進行應用升級,平臺關注的應該是給開發者、給上面的應用提供和創造更多的可能性。

接下來,飛天 AI 平臺和飛天大資料平臺、達摩院將構建起資料、演算法、計算的 AI 生態閉環,更好地為開發者服務,為客戶創造價值。

飛天AI平臺重磅釋出!阿里擁抱AI這五年

阿里 AI 核心看達摩

在今年的雲棲大會上,AI 悄然佔據了 C 位,多項關鍵性創新技術成果的釋出代表著阿里技術長征又邁向了一個新的階段。

阿里對於 AI 的最早佈局,要追溯到 2014 年,一個神祕部門的誕生。

彼時,在矽谷上市活動剛結束不久,阿里便宣佈在矽谷建立 iDST(institute of Data Science&Technologies,資料科學與技術研究院),自那以後,馬雲對外的演講裡便高頻出現“DT”這個詞,在 IT 概念還未褪熱之時,馬雲提出的“DT”也著實時髦。

iDST 自誕生起就縈繞幾分神祕色彩,它甚少在出現在媒體報導中,鮮有人知道,這個單從名字上看研究資料科學的部門到底在做些什麼。它的目標在那時也顯得格外巨集大,確立阿里巴巴集團在未來數十年的技術領先地位。

iDST 的奠基團隊裡,大咖雲集。現任阿里巴巴達摩院高階研究員,機器智慧實驗室負責人金榕和螞蟻金服副總裁兼首席資料科學家漆遠是 iDST 的兩位創始人,二人都是應王堅之邀加入阿里。

“阿里巴巴是坐在金山上啃饅頭,阿里擁有龐大的資料金山,而資料的真正價值卻並沒有發揮出來”,王堅拿出了當年彭蕾遊說他的理由招徠漆遠,令王堅吃驚的是,“他真的非常果斷就來了”。之後,華先勝、周靖人、任小楓等頂尖科學家陸續加入 iDST。

“阿里 AI 戰略發展過程中,最大的轉折點是被團隊裡很多前輩稱之為‘上山下鄉’的運動”,阿里巴巴達摩院語音實驗室負責人鄢志傑回憶他在 iDST 時的日子,“我其實加入三個月後,就開始擁抱變化了,我被‘下放’到業務團隊,到了阿里雲 iDST”。

當時 iDST 的團隊成員多為科學家,他們重視基礎理論研究卻缺乏業務和實戰經驗,常被業務部門批評“不懂業務”。於是,為彌合這兩種矛盾,iDST 的團隊兵分三路“下鄉”,深入到業務團隊之中:金榕帶領一撥人加入了淘寶和天貓的搜尋部,漆遠和幾位同事去了螞蟻金服,原先做語音的團隊留在了阿里雲。

經過“上山下鄉”運動後,iDST 從直屬集團變成了阿里雲下屬的一個部門,看似力量削弱了不少,但實際上通過這三路”尖兵“,阿里的 AI 技術能力在各個核心的業務場景中全面開花。金榕去淘寶、天貓搜尋部後做出了拍立淘,還拿到了阿里最高榮譽“集團 CEO 獎”,漆遠去了螞蟻金服後,也收穫了 6 項阿里巴巴集團演算法大獎。

如今,iDST 升級為達摩院併成了阿里的核心技術中樞,但達摩院做技術佈局與研發的思路仍與 iDST 一脈相承,並在原基礎上做了延伸和發展。

2017 年,達摩院宣佈成立時,馬雲對它寄予厚望,他希望即便有一天阿里沒了但達摩院還在,達摩院必須活得比阿里巴巴更長。兩年過去了,達摩院逐漸成為阿里前沿技術實力尤其是 AI 實力上的代言者。

目前,達摩院關注機器智慧、資料計算、機器人、金融科技以及 X 實驗室五大領域,設定有 14 個實驗室。其中,機器智慧實驗室是阿里做 AI 研發最核心的部門,是阿里 AI 力量的匯聚地,其下設語音、視覺智慧、語言技術、決策智慧、城市大腦五個實驗室和一個智慧客服團隊,這些基本涵蓋了阿里在 AI 技術方向上的核心佈局。機器智慧實驗室的負責人金榕向 AI 前線表示,阿里將技術劃分成三個層面:基礎技術、業務技術、應用技術,並按照這個邏輯選定了上述研究方向。

在傳承 iDST 的基礎上,機器智慧實驗室的定位也發生了一些變化,其在為當下的 AI 技術做佈局的同時,也在為未來技術來做一些基礎性的研究,金榕表示。

阿里巴巴達摩院語音實驗室負責人鄢志傑回憶,伴隨著 iDST 的架構設立,阿里開始對以語音互動等技術進入嚴肅投入期。發展到一定階段和規模的阿里需要做一些技術儲備,從這個角度上看,iDST 的佈局是有一定前瞻性的,到現在的達摩院,也一直貫徹同樣的思路。

又一年雲棲至,這一年來,機器智慧實驗室有哪些技術創新和進展?金榕向 AI 前線介紹道:

在自然語言處理方面,最大的進步是深度語言模型,如今自然語言處理最大的挑戰是如何讓將人類語言變成數學能夠表達的東西,過去語言模型只是比較簡單的統計,現在的深度語言模型可以做到把語言很好地對映到數學空間上,這是一個很大的進步。深度語言模型另一個比較成功的應用是在問答上,又叫做機器閱讀理解,它跟一般的問答不同在於,過去 AI 問答一般需要事先設定一些 QA Pair,所有問題都需要判斷它跟 QA Pair 中的哪個問題比較像,再返回對應的回答。現在的機器閱讀理解可以直接給機器輸入一篇很長的文章或多篇文章,模型可以從文章中自動搜尋跟問題有關的答案。

計算機視覺方面:過去阿里最大的一項突破就是超大規模影象識別,目前阿里超大規模影象識別技術已經可以做到幾千萬 SKU,所有物品在阿里商品庫均能做到 87% 左右的識別率,其中的核心是如何有效進行大規模訓練和優化。金榕希望未來這個 SKU 還能再推到幾個億。

語音方面:目前阿里的語音合成技術已經能做到跟真人非常接近的程度,並被收錄到了  MIT 2019 十大突破性技術 中,與谷歌、亞馬遜同屬行業前列,其技術實現上借鑑了機器翻譯的一些方法。此外,阿里的語音合成技術不僅能在 Profile 上實現很好的效果,研發團隊還花了大量時間精力使模型的計算成本降低了一個數量級,從而很好地彌合了研究與商業化應用之間的鴻溝。

以下為達摩院兩週年的成績單:

飛天AI平臺重磅釋出!阿里擁抱AI這五年

鄢志傑表示,目前在阿里集團內部的電話客服、政務、智慧地鐵等多業務場景都用到了語音互動技術能力。近幾年阿里在語音互動領域取得的重大技術成果主要體現在兩方面,一是,語音識別的聲學模型在互動效果上更加自然。二是,去年釋出的業界最小的語音模組真正做到了簡單“複製”與機器互動的能力。在本次雲棲大會上,這個模組又有了最新的升級:體積更小、功耗更低、更便宜、更易被整合。這裡的“被整合”指阿里的語音技術可以幫助其他在語音互動領域探索的客戶做業務升級。

“在我們團隊,禁止講‘賦能’”。

賦能無疑是當下科技網際網路圈常用的高頻熱詞之一,阿里為何禁提“賦能”?鄢志傑繼續解釋道,很多傳統企業在垂直領域深耕多年,專業能力紮實,阿里的技術並非為其賦能,而是幫助客戶產生價值,阿里技術的價值在於將門檻降低、讓更多人使用,從而產生廣泛的社會價值。

現在,達摩院更多扮演了阿里巴巴 AI 技術中臺的角色,其核心能力通過雲來輸出,當小前臺需要語音、影象等技術的時候,技術中臺會為其提供源源不斷的技術服務和支援。

科學家下田野

曾經在較長的時間裡,很少有人會覺得阿里是一家技術公司。“百度的技術、騰訊的應用、阿里的產品”,業界常認為在 BAT 中,阿里是技術實力最弱的,片面印象的形成除了阿里強大的電商基因,還因為英語老師出身的馬雲不懂技術,這在技術公司中是少見的,不論是李彥巨集、馬化騰還是張一鳴、雷軍、周鴻禕、丁磊等人皆是程式設計師出身。

兩年前,在達摩院成立時,馬雲談到這點時說道,“我沒覺得不懂技術多丟人,不懂技術裝得懂技術才丟人。我確實不懂技術,但我們尊重技術、欣賞技術、信仰技術”。

今天,可能已經很少有人否認,不懂技術的馬雲帶出了一家技術最強大的公司之一。甚至有觀點認為阿里在技術上的成功恰恰是因為馬雲“不懂技術”。

2018 年 10 月 31 日,在退休之前,馬雲最後一次以董事局主席的身份致信股東,他表示,9 年前阿里已經轉型為一家技術公司,已在大資料、雲端計算、人工智慧、物聯網上做了全面佈局和準備。

“阿里在商業上的成功掩蓋了它技術上的實力和投入“,阿里巴巴技術長行癲(張建鋒)曾感慨,言語之間夾雜著些許“委屈”的情緒。

普華永道釋出的《2018 全球創新企業 1000 強》報告中顯示,阿里巴巴的研發支出連續三年居中國上市企業之首。2018 年,阿里研發支出達 247 億元,是騰訊的 1.3 倍、百度的 1.8 倍、攜程的 2.7 倍、京東的 4 倍,其最近兩年的研發費用佔總收入的比例高達 15.65%。

伴隨著人工智慧熱潮的來臨,BAT 紛紛擁抱 AI。在 AI 的佈局上,三家也各有千秋。

百度對 AI 的佈局是最早的,阿里次之,騰訊最晚。2013 年 1 月,百度宣佈成立深度學習研究院(IDL),李彥巨集親自擔任院長,同年 4 月,百度深度學習研究中心在美國成立。為佈局 AI,百度先後招徠了吳恩達、陸奇等 AI 大神加盟。在百度的 AI 佈局中,百度大腦、自動駕駛、百度智慧雲是重點押注的方向,百度大腦整合了深度學習、語音技術、視覺技術、自然語言處理、知識圖譜等核心技術,目前已經升級到 5.0,且由百度大腦核心能力支援的 Apollo 和 DuerOS 兩大 AI 開放平臺的生態體系漸豐。在自動駕駛方面,百度在該領域的專利申請量居國內第一。

相較 BA,騰訊在佈局 AI 上有些後知後覺。在 2017 年 11 月的騰訊全球合作伙伴上,騰訊 CEO 任宇昕將“AI in all”作為騰訊發展 AI 的願景。在去年 9 月進行的第三次組織架構調整中,雲和 AI 被騰訊視為擁抱“產業網際網路”的關鍵武器。在內部,騰訊的 AI 力量較為分散,主要有騰訊 AI Lab、騰訊優圖、WechatAI 三大實驗室,專注計算機視覺、語音和語義理解、自然語言處理和機器學習等方向,因為存在賽馬機制,三大實驗室關注的研究方向會有重合之處。近兩年,騰訊一直倡導“科技向善”,試圖將其打造成騰訊 AI 具有辨識度的標籤。目前,在計算機視覺領域,騰訊 AI 優勢明顯,其在醫療、金融、零售方面的應用較強。

依託電商場景和資料金礦優勢,阿里在智慧客服、語言 / 語義理解、自然語言處理、計算機視覺等 AI 研究方向上具有顯著優勢。阿里最早做 AI 時主要是業務驅動,完全從演算法角度做,現在越來越完善,從演算法到框架到硬體,最近兩年,在軟體之外,阿里 AI 還在向硬體發力。去年 9 月 19 日,在 2018 雲棲大會上,阿里巴巴 CTO、達摩院院長行癲宣佈成立平頭哥半導體公司。成立近一年來,平頭哥先後釋出了晶片玄鐵 910 和一站式晶片設計平臺 “無劍”。

在 9 月 25 日雲棲大會現場,阿里巴巴 CTO 行癲(張建鋒)釋出了由平頭哥研發的阿里巴巴第一顆“大晶片”—含光 800,據稱它是全球最高效能的 AI 推理晶片,在業界標準的 ResNet-50 測試中,含光 800 推理效能達到 78563 IPS,比目前業界最好的 AI 晶片效能高 4 倍;能效比 500 IPS/W,是第二名的 3.3 倍。隨著含光 800 的釋出,平頭哥端雲一體全棧產品系列初步成型,涵蓋處理器 IP、一站式晶片設計平臺和 AI 晶片,實現了晶片設計鏈路的全覆蓋。

“在全球晶片領域,阿里巴巴是一個新人,玄鐵和含光 800 是平頭哥的萬里長征第一步,我們還有很長的路要走”。 張建鋒表示,阿里巴巴未來將用“軟體的優勢”、“網際網路公司的速度”做晶片,目標是轉型為一家軟硬體協同一體化的科技公司。晶片或許會成為阿里佈局 AI 生態具有辨識度的一個標籤。

在技術公司轉型的過程中,阿里強大的電商基因與技術戰略相互融合,倒是形成了一種饒有特色的新特點。場景能夠與技術深度融合是阿里發展 AI 技術最大的優勢和發展策略。縱觀如今的 AI 創業公司發展現狀,90% 的 AI 創業公司燒錢太厲害卻賺不到錢,根源在於找不到合適的落地場景、天然具有大規模應用場景、業務倒逼技術發展的阿里則很好地規避了這個問題。

達摩院成立伊始,馬雲就曾直截了當地告訴王堅,這 1000 億啟動資金給你就是創業啟動資金,未來是要靠自己掙錢的,90% 以上研究的東西,不能只在實驗室裡面,必須在市場上。馬雲認為,只有讓企業家和科學家完美結合,這個世界才有未來。

“阿里有一大特色,叫做科學家下田野,科學家也會去見客戶”。

鄢志傑打趣地說道,這個特色在 iDST“上山下鄉”運動時已經體現得淋漓盡致。他認為,商業價值倒逼需求也是阿里 AI 的與眾不同之處,“AI 技術怎樣上雲,如何幫助阿里雲生態的夥伴創作價值,在一定程度上,這並不是一個主動選擇,而是一種被迫選擇,是阿里雲天然使命的倒推。除了刷榜和純技術因素以外,一項技術能夠給社會產生什麼樣的價值,阿里雲在這方面的思考比別人早一點。現在看到,別人也都走上這條路了。在聽到來自市場、商業環境前線的‘炮火’的時候,阿里希望去做一些真正對 AI 產業化產生影響力的產品”。

擁抱 AI 已經成了全球科技公司的主流戰略,但不同的公司有各自的技術路線,賈揚清覺得阿里最大的優勢是學以致用,與很多公司通過演算法需求往下設計系統、搭建架構不同,阿里是一個囊括底層架構、硬體等的更加全棧的環境,上面的業務需求、應用很容易通過融進業務中接受到大規模的錘鍊並找到接下來的演進方向。

飛天AI平臺重磅釋出!阿里擁抱AI這五年

阿里 AI 全景圖

一般而言,衡量和評判一家公司的 AI 實力,需要從三個維度做考量:系統能力、演算法能力、應用能力。系統能力主要考慮 AI 的基礎架構、軟體協同設計,可從整個開發者平臺的實力、落地場景中體現出來;阿里的演算法能力主要體現在達摩院上,如在影象識別方向的演算法研究上,阿里已取得顯著成果。應用能力的目標是希望讓每一個人都非常自然地使用 AI,談到該能力,賈揚清認為,目前整個業界在 AI 應用層面還處於早期階段,應用能力的提升是最終讓“AI 擁有無限可能”的必經之路,這也是阿里推出飛天 AI 平臺的目標所在。

今天,阿里巴巴首次公佈了其人工智慧呼叫規模:每天呼叫超 1 萬億次,服務全球 10 億人,日處理影象 10 億張、視訊 120 萬小時、語音 55 萬小時及自然語言 5 千億句。

飛天AI平臺重磅釋出!阿里擁抱AI這五年

一年前,金榕曾在接受採訪時表示希望能夠幫助阿里巴巴從一個技術的跟隨者變成領導者,並在一些重要技術上取得領先。現在再來看這個目標,金榕欣喜地看到阿里 AI 發生了兩個很重要的變化:已經不少團隊在順著這個目標為核心去努力,且有很多團隊不僅在考慮解決當下單純的業務問題,而著眼到更遠處希望解決未來根本性的問題。

“我認為這兩件事能夠讓阿里在未來做到 Leader。做 Leader 一定是一個堅持的過程”。



https://www.infoq.cn/article/DpTcxmsVcpD4clq2p5VB



來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/29829936/viewspace-2658427/,如需轉載,請註明出處,否則將追究法律責任。

相關文章