阿里巴巴釋出全球最強AI晶片,芯雲戰略終成型!

半導體行業觀察發表於2019-09-25
自去年成立平頭哥半導體公司後,阿里巴巴在晶片方面的落子越發頻繁。在今日的雲棲大會上,平頭哥正式釋出了阿里的第一款晶片——含光800。

含光為上古三大神劍之一,該劍含而不露,光而不耀。阿里巴巴用它來作為公司首款晶片的命名,體現了他們在這個領域的雄心與謙遜。

阿里巴巴集團CTO、達摩院院長張建鋒說:“在全球晶片領域,阿里巴巴是一個新人,玄鐵和含光800是平頭哥的萬里長征第一步,我們還有很長的路要走。

阿里巴巴釋出全球最強AI晶片,芯雲戰略終成型!

軟硬協同,造就全球最強的AI晶片

阿里巴巴方面介紹,含光800雖然是阿里巴巴第一款晶片,但卻是全球效能最強的AI晶片。作為一款主要用於雲端視覺處理場景的晶片,含光800的效能打破了現有AI晶片記錄,在效能及能效比方面統領全球第一。

阿里巴巴釋出全球最強AI晶片,芯雲戰略終成型!

在業界標準的ResNet-50測試中,含光800推理效能達到78563 IPS,比目前業界最好的AI晶片效能高4倍;能效比500 IPS/W,是第二名的3.3倍。

阿里巴巴釋出全球最強AI晶片,芯雲戰略終成型!

能達成這樣的表現,得益於軟硬體的協同創新。

阿里巴巴方面的專家指出,傳統CPU、GPU在深度學習推理任務上並沒有完全發揮硬體能力,例如GPU架構主要針對影像處理設計,其硬體結構、軟體生態幾乎固化,因此對AI任務很難有深度最佳化。為此,阿里巴巴在首先在晶片架構上面做了創新。

據介紹,含光800採用自研架構,針對深度學習中使用的大量權重引數張量資料,在支援稀疏壓縮與量化處理的基礎上,透過獨特設計的資料訪存與流水線處理技術,大大減低了I/O需求和資料的搬移;同時深度最佳化了卷積,矩陣乘,向量計算和各種啟用函式,透過高有效的硬體資源排程和全並行的資料流處理,把AI運算的效能和能效雙雙推向極致。

“傳統通用處理器基於馮諾依曼結構,其儲存和運算處理是分離的,如果處理深度神經網路,需要大量讀寫執行操作,會受到頻寬限制,因此效率較低。而以含光800為代表的神經網路晶片,根據神經網路推理運算特徵,設計特定的硬體神經元、高速連線的儲存結構以及專用指令集,對記憶體和計算單元實現高效組織管理,實現單條指令完成多個操作,提高計算效率和記憶體訪問效率” 

來到演算法這邊,一方面,阿里巴巴達摩院機器智慧實驗室過去兩年構建了涵蓋語音智慧、語言技術、機器視覺、決策智慧等方向完整的演算法體系,並且取得多個世界領先水平的成果。 

“基於這些能力,平頭哥突破了演算法和硬體之間的鴻溝,基於阿里巴巴豐富的場景和達摩院演算法能力,自研晶片架構,並且設計了完整軟體棧”,阿里巴巴專家強調。這樣的設計理念也讓整個晶片的效果立竿見影。

例如為了解決人工智慧晶片行業的通病——功耗,阿里巴巴在自研架構上大幅減少了對記憶體的訪問,這就保證極致效能的情況下,把晶片功耗降到最低水平。

值得一提的是,平頭哥用最短的時間完成了晶片的設計、流片整個過程。其中7個月完成了前端設計,之後僅用了3個月就成功流片。

初露鋒芒,含光800已落地應用

在過去幾年的AI晶片浪潮裡,大家一直詬病的是——不少AI晶片公司只是高調搞了個釋出會,但對於晶片的落地,其實沒有太多的場景和想法。這也是整個人工智慧行業的癥結所在。但對於阿里巴巴而言,天然解決了這一問題。阿里經濟體擁有包括影像影片分析、搜尋和推薦在內的豐富人工智慧應用場景,這都需要AI專用晶片提供算力。

含光800一方面基於這些場景打造,另一方面又反哺場景,提升這些領域的計算效率。

據瞭解,含光800目前已經實現了大規模應用,應用於阿里巴巴集團內多個場景:例如影片影像識別/分類/搜尋、城市大腦等。依託阿里巴巴集團豐富的應用場景,他們早期就針對場景做了大量最佳化,並實現了效能上的突破。在未來,這個晶片甚至還可被應用於醫療影像、自動駕駛等領域,阿里巴巴的專家強調。

在實際應用中,這款強大的AI芯在實際應用中表現也相當優越。

根據雲棲大會的現場演示,在城市大腦中實時處理杭州主城區交通影片,需要40顆傳統GPU,延時為300ms,使用含光800僅需4顆,延時降至150ms。拍立淘商品庫每天新增10億商品圖片,使用傳統GPU算力識別需要1小時,使用含光800後可縮減至5分鐘。

阿里巴巴釋出全球最強AI晶片,芯雲戰略終成型!

更為關鍵的是,其不僅服務阿里內部場景,還將全面透過雲服務開放。據瞭解,,基於含光800的AI雲服務已正式上線。

阿里巴巴方面的專家表示,在人工智慧場景中,含光800是傳統異構計算很好地補充,透過阿里雲可以為企業提供更多的選擇,未來他們還會推出更多形態的人工智慧晶片,在終端、雲資料中心都會有更大規模的部署和應用。

“對於受限於算力瓶頸的企業而言,含光800可以更高效地執行更復雜、更先進的演算法”,阿里巴巴方面舉例說。

端雲一體晶片格局成型

在釋出了含光800以後,阿里巴巴的端雲晶片佈局已經成型。

這家國內晶片“新晉”不止一次強調,平頭哥的目的並非賣晶片。公司延續了母體阿里巴巴集團“讓天下沒有難做生意”的願景,開闢了全新的商業模式(平頭哥模式),致力於為企業提供普惠算力,目前已經擁有全棧晶片產品家族,涵蓋終端處理器IP、終端晶片設計平臺SoC、雲端AI晶片

在端側,平頭哥已擁有成熟的生態體系, CK801、CK802、CK803、CK805、CK807、CK810、CK860等7款自研嵌入式CPU IP核均已得到大規模量產的驗證,授權客戶超100家,累計銷售超十億顆,廣泛應用於機器視覺、工業控制、車載終端、行動通訊和資訊保安等領域;除此之外,基於RISC-V架構的玄鐵處理器以及無劍SoC平臺也已服務各行業企業,例如人工智慧企業雲天勵飛、老牌晶片商炬芯科技等。

在雲端,這次釋出的含光800就是一款代表作,全球前三、亞太第一的阿里雲為平頭哥服務企業提供了絕佳平臺,未來企業可以透過阿里雲輕鬆獲取含光800的極致算力。未來他們還會在這個領域繼續升級。

談到未來的產品規劃的時候,阿里巴巴方面表示,公司產品形態還會進一步完善,例如雲上AI訓練晶片和端上的AI推理晶片就是下一步的目標。目前平頭哥還在研發用於阿里雲神龍伺服器的SoC專用晶片,以滿足更多場景的算力需求。

過去十年,阿里巴巴的AI和雲端計算齊頭並進,在這兩大領域,已經躋身全球前列。在晶片領域的佈局,則補齊了阿里技術版圖的一大短板,更為關鍵的是,三大領域已經展現出了化學反應:

作為業界最大的人工智慧應用者之一,阿里巴巴擁有豐富的應用場景,在此之上達摩院已建成完善的演算法體系,涵蓋語音智慧、語言技術、機器視覺、決策智慧等方向,並取得多個世界領先水平的成果,在國際頂級學術會議上共發表了近400篇頂級論文;阿里雲穩居全球雲端計算廠商前三、亞太第一的位置,超過一半的中國A股上市公司和80%中國科技類企業在使用阿里雲的服務。

平頭哥則得到了達摩院和阿里雲的軟實力加持,例如基於達摩院的演算法能力,打破了演算法和硬體之間的鴻溝;基於阿里雲飛天雲平臺的優勢,快速形成了端雲一體晶片生態,玄鐵系列處理器以及無劍平臺大幅降低終端晶片設計的門檻,含光800透過阿里雲輸出給全社會,讓企業隨時隨地可以享受到極致算力。

“晶片、AI和雲端計算三位一體、協同發展——人工智慧演算法逐漸整合到晶片,整合演算法的專用晶片為雲服務提供了更強的效能,而雲端計算本身則加速了人工智慧應用的大規模落地”,阿里巴巴方面補充說。

阿里巴巴晶片大圖已現

根據阿里巴巴在晶片上的定位,那就是端上做晶片基礎設施,雲端為企業提供普惠算力。例如,處理器是所有高階系統晶片都需要的產品,它是最核心的基礎設施產品,AI晶片是人工智慧場景最高效的算力單元,阿里將投入重金打造好這些技術,同時構建應用生態。

而探索他們在晶片、AI和雲端計算三位一體的策略中,SoC開發平臺無劍在當中扮演了一個很重要的角色。

在前文我們提到,阿里巴巴擁有眾多的晶片IP,同時在雲端也能提供足夠的算力,在AI方面也有深入的研究。對於那些想在他們平臺上打造差異化的開發者來說,缺失的就是終端這塊方面的硬體實力。而在這個領域,有一個明顯特徵,那就是開發者們都在基於其特定化的需求打造ASIC,而平頭哥的無劍開發平臺,正是為了解決這個問題而生的。

阿里巴巴釋出全球最強AI晶片,芯雲戰略終成型!

據平頭哥方面介紹,無劍是面向AIoT時代的一站式晶片設計平臺,提供集晶片架構、基礎軟體、演算法與開發工具於一體的整體解決方案,能幫晶片設計企業將設計成本降低50%,週期壓縮50%。

“在這個平臺研發晶片的企業,只需專注於20%的專用設計工作量,並讓這20%的工作產生80%的價值”,平頭哥強調。

除此之外,阿里巴巴旗下的平頭哥還將將成立晶片開放社群,進一步為晶片產業提供開放協作的平臺;公司還將繼續開發作業系統,軟硬體融合的演算法,核心的IP等。把這些共性的技術能夠做好做精做出競爭力,並形成生態,然後開放給其合作伙伴,讓他們基於高質量的基礎設施打造晶片產品,有助於提升整體的產業競爭力。

憑藉這一系列的領先產品,阿里巴巴在AIoT賽道上佔有了其他廠商並不具備的先機。站上了未來萬億市場的風口。

相關文章