UCIe聯盟創始會員再添兩員“得力干將” 阿里巴巴和NVIDIA聯手入選

陶然陶然發表於2022-08-04

  美國東部時間8月2日上午,UCIe聯盟正式官宣:新增阿里巴巴和NVIDIA兩家Promoter成員單位。截至目前,UCIe聯盟已經吸納了12家行業巨頭企業,併成立了6個工作組,旨在打造更全面的Chiplet生態系統。

  那麼問題來了,什麼是Chiplet?行業巨頭為什麼要合力推動Chiplet創新?UCIe聯盟為什麼選擇阿里巴巴這樣的雲廠商?這些雲廠商在聯盟中的價值有哪些?且聽我慢慢道來。

   小晶片成大趨勢

  Chiplet(芯粒)是在2015年Marvell創始人之一週秀文博士曾提出Mochi(Modular Chip,模組化晶片)架構的概念,這是Chiplet(芯粒)最早的雛形。

  幾十年來,半導體行業一直按照摩爾定律的規律發展著,晶片製造商憑藉工藝技術的迭代,每18個月令晶片效能提升一倍。

  但近年來隨著高效能運算、圖形計算、人工智慧等領域的爆發性增長,當前的計算架構早已無法滿足指數級攀升的算力需求。然而計算技術本身卻面臨著更加嚴峻的挑戰,包括日益趨緩的摩爾定律、越來越高的晶片製造成本、以及晶片尺寸的物理限制等。

  產業開始思考將不同工藝的模組化晶片,像拼接樂高積木一樣用封裝技術整合在一起,在提升效能的同時實現低成本和高良率,這就是Chiplet(芯粒)。

  筆者認為,基於小晶片的計算架構正在演進成為一個計算架構發展的大趨勢,我們相信它將為資料中心的未來計算技術,在效能、功耗、可擴充套件性、可持續性等諸多層面帶來巨大優勢。

   業內需要統一的Chiplet互聯標準

  要知道,使用小晶片架構並不是免費的。除了各種封裝和堆疊技術外,也要解決小晶片之間通訊的面積和功耗開銷,以及如何讓小晶片之間協同工作、整合驗證和最佳化、建立穩定軟硬體生態等操作層面的實際問題。

  因此,在2022年3月,英特爾、AMD、Arm、高通、臺積電、三星、日月光、Google雲、Meta、微軟等十大行業巨頭聯合成立了Chiplet標準聯盟,正式推出了通用Chiplet的高速互聯標準“Universal Chiplet Interconnect Express”(通用小晶片互連,簡稱“UCIe”),旨在定義一個開放的、可互操作的Chiplet生態系統標準。

  今天,阿里巴巴和NVIDIA作為新的成員加入了聯盟,這對UCIe來說是一個新的里程碑。

  在與HPCwire的預先簡報中,UCIe聯盟主席Debendra Das Sharma引用了Gordon Moore 1965年著名論文中的一段話:“用較小的功能構建大型系統可能更經濟,這些功能是分開的封裝和互連,”摩爾在“Day of reckoning”子標題下寫道。UCIe的支持者認為,至少在某些用例中,這一天已經到來。

  UCIe標準將使晶片設計人員能夠混合和匹配來自多個來源的晶片和其他具有不同封裝選項的晶片元件。UCIe 1.0規範定義了標準化的晶片到晶片互連,包括物理層、協議棧、軟體模型和一致性測試。它本機對映PCI Express (PCIe)和Compute Express Link (CXL)協議。

  據瞭解,該聯盟成立了六個工作組。其中五個技術工作組涵蓋電氣、協議、外形/合規性、可管理性/安全性以及系統和軟體。此外還有一個營銷工作組。

  同時,UCIe成員分為三個級別:發起人、貢獻者和採用者。發起人由董事會組成並具有領導作用。貢獻者和發起者公司可以參與工作組,而採用者只能看到最終規範並獲得智慧財產權保護。

  根據Das Sharma的說法,目前的聯盟名單已鎖定四年,以作為穩定措施,但該聯盟對新的貢獻者和採用者級別的成員開放。

  據介紹,貢獻者成員每年支付10000美元的會費,而採用者(不能參加工作組,但獲得規範訪問和智慧財產權保護)可以每年支付2500美元加入。會員資格的第一年還包括與年度金額相等的一次性啟動費,這使第一年的贊助費達到20000美元,採用者為5000美元。

  Das Sharma表示:“業界對我們宣佈UCIe的反應非常積極,我們現在已經擁有60多家公司,我們的正式成立是一個重要的里程碑,因為我們有一個雄心勃勃的計劃,繼續發展UCIe技術以滿足行業需求並開發全球可互操作的小晶片生態系統。”

  按理說,由最開始十大巨頭組成的UCIe聯盟已經非常有話語權了,為什麼這次還要增選阿里巴巴和NVIDIA呢?

  如果我們們嘗試分析一下聯盟成員的組成,你會發現一些規律:例如,UCIe標準達成並得到推廣後,英特爾至強處理器、AMD霄龍處理器、高通驍龍處理器,都可以在UCIe的框架下,和其他不同工藝、不同功能的Chiplet晶片,透過2D、2.5D、3D等各種方式整合在一起,從而更靈活地製造模組化的大型晶片。

  再例如,Google雲、Meta、微軟等企業也提出了小晶片互聯的資料面(物理層、連結層和協議層)和控制面(管理、安全、測試等)開源標準。

  因此,UCIe聯盟的納新是非常有必要的,今天,NVIDIA和阿里巴巴的加入,使得UCIe增加了一個新的大型矽供應商以及一個超大規模/矽供應商。NVIDIA將在GPU和AI領域貢獻力量,阿里巴巴可以得到最真實的使用者反饋,並推動社群和生態發展,合力構建一個完整且相容的生態系統。

   雲廠商在Chiplet領域的能力和未來發展

  我們知道,UCIe聯盟的發起者中有晶圓廠、封裝廠、IP和雲廠商,大家在為共同的目標貢獻自身力量,雲廠商在其中發揮著關鍵作用。

  作為首批加盟UCIe的雲廠商,Google雲、Meta、微軟擁有龐大的使用者群,他們致力於解決專用架構和晶片互聯協議之間的互操作,使能不同廠商的小晶片設計和整合並幫助建立統一市場。同時,他們還可以將聯盟中取得的成果反饋給使用者,從而得到反覆的驗證和最佳化。因為,只有讓Chiplet生態變得成熟,雲廠商才能擁有更適合的定製化晶片。

  筆者看來,本次阿里巴巴的加入非常具有代表性,即使得UCIe聯盟中雲廠商又增一員,又是大陸地區唯一入選UCIe聯盟的企業。

  說到雲廠商,我相信放眼全球,阿里雲都會有一席之地。作為本次UCIe聯盟增選的成員,阿里雲有兩層身份:首先阿里雲代表了聯盟中為數不多的CSP廠商;其次阿里雲還是一家重度晶片技術和產品的使用者。要知道,阿里雲很早就開始了資料中心晶片的定製工作,並在2021年雲棲大會上重磅釋出了平頭哥倚天710晶片,更是積極的Chiplet技術使用者。

  此外,我們發現阿里雲也在Chiplet的軟體生態層面不斷髮力。透過UCIe等高速互聯技術,多種不同功能或能力的Chiplets可以封裝在一顆晶片內,很自然地實現了片上異構計算。然而,由於片內硬體資源受限,為了使能片上異構的多處理器平行計算,業界需要更加輕量級的計算框架;同時針對片上互聯接近於零的通訊延遲,計算框架也需要研發有別於傳統最佳化的新穎策略。

  據瞭解,阿里雲從2017年開始投入建設的震旦異構計算開放平臺(HALO/ODLA),因其可裁剪可擴充套件的輕量級介面、極簡的記憶體足跡、和內稟的異構並行支援,非常適宜於作為小晶片加速系統的軟硬協同計算平臺。

  目前震旦異構計算平臺作為使能Chiplet異構計算框架的潛力已經獲得了包括行業和高校等研究者的認可。今年6月,在紐約舉行的國際計算機架構頂會ISCA2022上,由阿里雲基礎設施異構計算團隊張偉豐博士牽頭髮起和組織了第一屆HiPChips研討會(高效能Chiplet 與互聯架構國際研討會),來自阿里雲的專家也分享了震旦異構計算平臺在Chiplet異構計算框架上的計算進展。

  著眼未來,基於Chiplet的軟硬協同設計帶來的算力基礎設施效能和能效比的提升,是阿里雲所迫切需求的,Chiplet標準化和軟硬體生態同樣也是阿里雲所看重的,“一雲多芯”的技術策略也會逐步從Chip細化到Chiplet。阿里雲正在透過自身的貢獻和努力,幫助晶片領域相關產業鏈生態夥伴共同構建統一的生態系統。

來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/28285180/viewspace-2908961/,如需轉載,請註明出處,否則將追究法律責任。

相關文章