從智慧計算的點、線、面,讀懂浪潮AI的進化軌跡
抽象派畫家康定斯基曾這樣形容藝術:用點線面這樣最基本的語言單位,來表達豐富的內涵,賦予藝術以超凡的精神。
之所以想到這個略顯抽象的描述,是覺得藝術的表達與科技產業的構建有著相似的邏輯與核心:都是透過一些具象的符號來彼此互動、牽引、聯動,最終呈現出大到人類藝術文明,小到技術進步的完整過程。
在這個ICT技術爆炸、智慧世界創生的時代,湧現出了許許多多的符號,比如5G、AI、雲端計算、IoT、HPC等一系列技術名詞,亦或是新基建、數智化、AI產業化等等趨勢性的表達。到底智慧世界的“魂”是什麼?也就成了大眾以及每一家企業、每一個行業在變革風暴來臨時,渴望率先抓住的本質。
經過了漫長的基礎設施與市場教育週期,我想,該有人來回答這個問題了。
前不久,浪潮的NF5488A5在國際權威基準測試MLPerf中打破了18項紀錄,拿下了全球AI伺服器最好成績。再結合浪潮在疫情大背景下以53.5%的份額持續領跑AI伺服器市場等表現,由它來詮釋產業AI化的內涵與外延,似乎再合適不過。
欣賞一部藝術作品,需要對點線面等視覺符號的把握和理解,進而感受出美的真諦。同樣,對浪潮勾勒出智慧計算產業形態的點線面體的理解,也成為讀懂科技之魂、觸達未來的一把鑰匙。
點:AI伺服器牽引的算力之源
“點”是聚神、點睛的精華之筆,就像一個光源,能讓整部作品都發揮出靚麗的光彩。而ICT產業的進化史上,同樣有一些重要的關鍵詞,將整個行業推向了全新的發展階段,比如傳統計算時代的積體電路,又比如智慧時代的AI伺服器。
當我們審視當下如火如荼的AI產業化熱潮,會發現其本質是對龐大資料的處理、訓練、挖掘來完成產業端的價值創生。蓬勃發展的數字經濟,也讓提供澎湃算力的AI伺服器,成為產學研用各界的共同呼喚。
《2019-2020中國人工智慧計算力發展評估報告》顯示,全球資料保有量將從2018年的33ZB增⻓到2025年 的175ZB。這一趨勢必然導致計算資源水漲船高,實際上,算力基礎設施早已是各個企業部署、發展AI的首要支出。
在火熱的AI伺服器市場中,浪潮的表現可謂一騎絕塵。2020年上半年,浪潮AI伺服器銷售額達到6.88億美元,市場份額佔比53.5%。從市場規模和產品能力來看,浪潮早已經進入了該領域的領導者象限。
在疫情期間獲得這樣的增長與業績,究其原因,一方面源於浪潮本身在高效能運算領域的多年積累,市場根基穩固;另一方面則是踩準了AI計算的需求劇增,順利完成了產品革新。
拿剛剛打破AI效能紀錄的浪潮NF5488A5來說,就在Resnet50訓練任務中創下AI效能紀錄,以33.37分鐘完成百萬張影像訓練任務的優秀成績,成為單伺服器效能成績中的榜首。簡單來說,就是做AI訓練、AI推理都是(該比賽中)最快的伺服器。
如果僅僅是去一場比賽、參與一次“跑分”,並不足以成為那把引燃需求的科技之火。浪潮的特別之處在於:
首先,打造產業標準的中國名片。作為業內首套衡量機器學習軟硬體效能的通用基準,MLPerf的聯盟成員包括谷歌、微軟、Facebook、阿里巴巴、浪潮等企業,以及史丹佛、哈佛等高校。而與浪潮5488A5同場競技的還有來自英特爾、英偉達、聯想、廣達、技嘉等頭部廠商的參賽團隊。在這樣一個國際化測試中,浪潮NF5488A5的勝出在宣告中國計算實力的同時,進一步拉高了產業技術的實力上限,讓產業界和企業客戶能夠獲得給有效的參考標準,成為牽引伺服器市場加速進化的中國力量。
其次,強調伺服器的全面能力。MLPerf並不僅僅是單純的跑分,在實際賽程中,設定了資料中心、邊緣端等多種開放模型的多個測試,考驗的是伺服器在AI計算和實際應用場景的綜合能力。浪潮NF5488A5問鼎的AI推理基準測試18項紀錄中,就覆蓋影像分類、自然語言理解、智慧推薦、語音識別等場景,在Bert 自然語言理解推理任務中效能達26675條/秒,DLRM智慧推薦每秒推理處理能力達210萬條。
綜合能力意味著,贏得比賽不是伺服器廠商們在靠實驗室技術“自娛自樂”,而是可以真實進入到語音識別、金融分析、智慧客服等大眾熟悉的AI應用場景中去的,能夠切實提升AI開發與應用效率,加速產業AI化的程式。
最後也最值得注意的是,作為浪潮自研的新一代AI伺服器,NF5488A5身上展現出了由軟硬體協同帶來的卓越效能——這是此次MLPerf全球競賽中唯一可以在4U空間內支援8塊安培架構A100 GPU實現NVLink高速互聯的AI伺服器。
極致效能並不來自於簡單的堆疊,浪潮的綜合技術能力被充分投擲在了AI伺服器NF5488A5身上。比如在硬體層面,對CPU、GPU硬體效能進行精細校準和全面最佳化,以在AI推理時保持最優狀態;軟體層面,結合GPU硬體拓撲對多GPU的輪詢排程最佳化,使單卡至多卡效能達到了近似線性擴充套件;演算法層面,浪潮透過自研通道壓縮演算法成功實現了模型的極致效能最佳化,在精度無損的情況下效能提升近2倍。在可靠性上,透過深度最佳化系統結構設計,浪潮確保了裝置能夠在高溫環境下穩定執行。
對計算需求的充分理解與支援,AI伺服器產品的全面技術釋放,從這個角度,我們就可以理解,浪潮為什麼能俘獲如此多企業客戶的青睞,成為伺服器市場上最強勁的上升力量了。
線:AI融入社會化大生產的橋樑
沿著伺服器市場的變化軌跡,不難發現,AI正是進化的初衷和終點。
無論市場還是學術界都認為,AI與高效能運算是一對絕配CP。2019年中國HPC TOP100行業應用領域機器系統份額圖中,榜單前十名的產品都具備了AI計算的能力。清華大學計算機系鄭緯民教授也曾做出判斷,認為“人工智慧應用有望成為超算的主流應用”。
原因也很簡單,深度神經網路規模越來越大,許多高精度模型的效能都依賴於超大規模資料集的訓練。而人工智慧的需求猛增,開啟千億規模的市場空間,也為伺服器市場帶來了全新機遇。
但二者並不是簡單地拼湊在一起就能成功,還需要解決許多技術問題。
比如AI計算要用到分散式架構,需要在硬體底層將很多加速器晶片協同在一起工作,為傳統數值計算設計的伺服器並不適合AI;用經典計算伺服器來執行AI演算法,無法滿足低功耗和價效比需求,不利於產業化等等。
讓高效能運算與AI加速融合,成為伺服器廠商在技術浪潮中拉開身位的關鍵賽點。
對於這一挑戰,浪潮選擇將其劃分為三個賽程:
賽程一,全棧AI技術積累,厚積薄發拉開競爭身位。
早在2017年浪潮就釋出“智慧計算”戰略,聚焦打造全球領先的AI算力。經過數年耕耘,構建起了包括AI框架最佳化、AI開發管理和應用最佳化等全棧AI能力,AI專利貢獻達到了中國前三。從硬到軟的全棧解決方案能力,讓浪潮能夠駕馭來自產業端的多種AI計算需求。
賽程二, 系統級最佳化,實現1+1>2的效能提升。
AI計算需要系統化的能力來支撐,包括領先的硬體、強大的軟體、高精度的演算法等等,透過對其進行整體最佳化,進而能夠實現一致、快速地部署,讓浪潮在競爭中形成了區隔。
賽程三,高價效比方案,推動AI泛在化。
從生產、聚合、排程、釋放算力這四大關鍵作業環節,浪潮都進行了創新,來支撐AI在邊緣端、移動端、IoT端、車端等各個計算裝置上的執行。比如在排程層面,透過從模型開發、訓練、部署、測試、釋出的全流程一站式高效交付,實現了300%的開發效率提升;在自動機器學習領域,浪潮AutoML Suite可實現企業級一站式模型自動構建,模型大小與計算量極致壓縮。這些努力都有效降低了AI在產業落地的成本門檻。
從2017年押注AI,到如今成為AI計算與千行百業之間那道硬核的產業橋樑,浪潮迎來了瓜熟蒂落的收穫季,也印證了那句話:凡事預則立不預則廢。
面:智算中心的價值空間
當我們漫步AI產業之林,感受從無人駕駛、智慧客服、智慧城市等等各個應用場景中所伸展出的一根根引線,就會發現,這一次轉型升級浪潮之所以具有澎湃的生命力,是因為藉助數字化基礎設施,各行各業能夠獲得智慧化動能,進而提升社會整體生產效率。
因此,能否提供適配垂直產業發展需求的算力基礎設施,就顯得尤為重要,自然也就不難讀懂浪潮透過智算中心,從點到面推進AI產業化的核心邏輯。
在浪潮看來,企業渴望透過轉型得到的智慧化能力,才是其擁抱AI的終極目標。因此,服務產業不能是單純的業務數字化,除了增加額外的收集、儲存、處理成本之外,並不能達到企業藉助智慧化提升效率、業務創新的本質訴求。
今年4月的浪潮雲資料中心合作伙伴大會上,浪潮率先提出了“雲、數、智”三者的融合發展,認為企業的IT基礎架構正在從傳統資料中心向智算中心轉型,要實現業務“賦智”。
總結來說就是,超算中心主要服務於國家基礎科研創新,而智算中心則致力於支撐產業界的智慧創新,以算力驅動AI模型來對資料進行深加工,為企業和個人提供智慧服務,進而推動產業升級和GDP高質量增長。
智算中心聽起來很美,浪潮具體是怎麼做的?想要回答這個問題,要找到源頭,看看產業究竟遭遇了哪些問題。
1.算力需求定製化。各個行業的業務模式、生產體系、數字化需求都各不相同,不光需要硬體和技術,還需要針對性的場景化定製解決方案。為此,浪潮選擇將智算中心打造成開放平臺,吸引合作伙伴與行業解決方案提供商來共同耕耘,打造垂直行業大腦,完成了通用算力到行業個性化需求之間的銜接。
2.產品效能領先性。在“一力降十會”的AI計算領域,技術和產品效能的領先性,是市場首先看重的。目前,浪潮已經形成了完整齊備的融合架構產品線,為智算中心打造全球領先的算力機組,包括全球效能最強的 AGX-5,全球最高密度 AGX-2等。針對高併發訓練推理叢集進行了架構最佳化,推出N20X 智慧網路加速方案,打造了業界功能最全的 AI 管理平臺AIStation,以及可自動建模、自動調參的自動機器學習平臺AutoML Suite。這些動作讓浪潮足以支撐起國民級的計算業務。
比如在國有六大銀行的伺服器中,浪潮的佔有率超過50%,每日服務數億筆金融交易。還幫助中國乃至全球最大、最複雜的線上客票系統,將售票能力從每天1500萬張提升至2000萬張……類似案例還有很多,如果有人需要尋找一個具備頂尖產品效能的計算廠商,浪潮毫無疑問會是第一選擇。
3.普惠AI可持續。對於浪潮而言,要實現普惠AI的目標,除了短期內“授人以魚”,更需要藉助智算中心的標準化開放和規模化集約效應,實現長期可持續的低成本智慧服務,讓AI像水電、像雲端計算一樣成為新的社會基本公共服務,更快的普及到每個人、每個企業。
可以看到,在浪潮智算中心戰略背後,正蘊藏著一場企業IT基礎設施的春雷湧動。
體:面向未來的生態迴圈系統
由點到面的價值釋放,足夠託舉起一個企業在數年間屹立於“浪潮之巔”。如果我們將眼光放到更遠的未來,會忍不住思考一個問題,整個產業長期繁榮發展的動能從哪裡來?
這並不是在無病呻吟。儘管AI已經進入了產業化高速發展階段,但依然存在許多瓶頸:
比如標準的不統一。目前網路上開放的AI平臺和各種能力百花齊放,AI的開發最佳化和部署仍然是一項技術複雜度很高的工作,需要一套通用、易用的AI開發和部署環境,降低這項工作的技術門檻。
再比如概念的泛濫。“追趕風口”的人多了,市面上各種各樣的軟硬體、解決方案、X算中心等等說法五花八門,由於缺乏共識和秩序,很可能會擾亂大眾認知、透支信任,進而損害整個行業的形象。引領行業走向規範化,需要領頭羊做出更多的努力。
為了搭建一個綜合技術、產業、平臺的生態迴圈系統,讓數智化熱潮的動能長久不息,浪潮也堅定地在生態方面做了許多投入。
對外,2019年,浪潮提出了元腦生態計劃,集合了具備AI功能開發核心能力的左手夥伴和具備行業AI整體方案交付能力的右手夥伴,疊加上浪潮的AI最強算力平臺,來助力產業AI化落地。比如與百度聯合開發的ABC一體機,在鋼表面質量檢測系統中,2小時完成以前人工檢測2、3天的工作量,鋼材的缺陷識別準確率達到99%以上。為緩解人象衝突,浪潮與西雙版納國家級自然保護區管護局合作,在雨林內實時收集亞洲象的行為資料和行進軌跡,實現毫秒級精準辨識,準確度高達96%。在金融、電力、交通、智慧城市、石油石化等行業,浪潮的影響力逐步釋放。
對內,浪潮積極推動國際化產業技術標準的建立,在全球系統效能評測標準組織SPEC中,發起並擔任機器學習(Machine Learning)技術委員會主席。還與百度、Facebook、微軟等共同開發OAM加速計算的開放規範(OCP Accelerator Module),推動AI計算多元化融合發展與產業化應用。
比起浪潮自身在AI計算領域的市場成功,這種用生態的繁榮之力,支撐起AI計算產業長久迴圈的做法,也讓浪潮得以收穫更為深遠的價值成長空間。
魂:寫自未來的奮鬥史詩
集齊了產業AI中所需要的“點線面體”各個符號,我們可以獲得一個關於計算產業在當下的靈魂屬性,也得以確認,到底是什麼推動了浪潮一路走來。
一個值得注意的細節是,2016年前後,以深度學習為代表的人工智慧所展現出的能量在全球掀起了熱議,絕大多數同業者還在觀望之際,浪潮就做出了非常堅決的戰略調整,選擇了押注AI,成為當時全球第一個全力投入研發基於NVLink高速AI伺服器的公司。
沒有任何市場調查資料或者前人的經驗可以告訴浪潮,AI伺服器到底會不會受歡迎。最後,浪潮全球第一個做出了在2U空間支援做8片NVLink 技術的V100 GPU的AI伺服器,還好市場反應告訴他們,自己做對了。
提前一年多的產業趨勢預判,靠的是幸運還是玄學?顯然都不是,早在多年前的ISC國際超算大會上,浪潮就曾釋出過將深度學習與高效能運算相結合的產品,這一次領先全球的技術革新,只是春播秋收的自然規律。
戰略方向的大膽判斷,執行途中的踏實穩進,產業共榮的開放瀟灑,最終形成了浪潮的AI之魂。
驚豔眾人的成績單背後,是搏擊風浪、勇立潮頭。浪潮相信了未來,於是,未來便流淌在了每一個具象的符號與動作裡。
來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/31561483/viewspace-2733148/,如需轉載,請註明出處,否則將追究法律責任。
相關文章
- 從計算到智算,計算產業掀起什麼樣的浪潮?產業
- 從Data+這步棋讀懂英方軟體的再進化
- 從AI加速器,看騰訊ToB生態的點、線與面AI
- 使用PostGIS完成兩點間的河流軌跡及流經長度的計算
- 熱概念冷思考:如何真正擊中智慧化浪潮的G點?
- 讀AI未來進行式筆記07量子計算AI筆記
- 計算兩條直線的交點
- 人工智慧導論——智慧計算(進化演算法+群智慧優化)人工智慧演算法優化
- AI讀雲,更懂深圳AI
- PCL 計算點雲的面積和體積
- 復旦-華盛頓EMBA:科創的奧E丨從《浪潮之巔》讀懂科技產業的四大定律下篇產業
- 一文輕鬆讀懂計算機病毒計算機
- 雲端計算的三次變革浪潮
- 從智慧化“天眼”看計算機視覺未來計算機視覺
- 深度:如何從系統層面優化深度學習計算?優化深度學習
- 如何從系統層面最佳化深度學習計算?深度學習
- AI相機設計資料原理圖:基於ZU3EG的智慧面陣讀碼AI相機AI
- 解讀雲端計算的定義和特點
- 從廣西的新基建耕種,讀懂一顆名為智慧體的種子智慧體
- 一文讀懂計算機視覺中的深度域適應計算機視覺
- SQL最佳化 —— 讀懂執行計劃SQL
- 【UI設計培訓基礎知識】設計中的點線面-線UI
- 就緒IT平臺走進智慧企業——智慧化浪潮中的領軍者大型系列報導
- 一文讀懂大資料實時計算大資料
- 《計算進化史》感受
- 90% 的 AI 企業面臨虧損,該如何在 AI 浪潮中搶灘登陸?AI
- 在點雲上計算兩點之間的測地線
- halcon xld線段中點、端點和角度的計算
- 從最硬核"買家秀",讀懂華為資料中心網路的智慧紀元
- 讀懂Java中的Socket程式設計Java程式設計
- 從單點智慧到全流程AI,騰訊雲智慧AI能力「成團出道」AI
- 從點線面體談開發到架構師的轉型架構
- ? 一文讀懂兩臺計算機之間是如何通訊的計算機
- 從湖南“軟硬兼施”,管窺三湘水畔的智慧浪潮
- three.js 裡的點,線,面JS
- 視覺化學習:利用向量計算點到線段的距離並展示視覺化
- 影片ai智慧分析邊緣計算盒AI
- 雲端計算-從基礎到應用架構系列-雲端計算的演進應用架構