賽靈思釋出 ACAP,向英特爾、英偉達開炮

AI科技大本營發表於2018-03-21


1985 年,賽靈思公司(Xilinx)推出全球第一款 FPGA 產品 XC2064。

本週一,賽靈思又推出重磅產品——ACAP(Adaptive Compute Acceleration Platform,自適應計算加速平臺)。

根據賽靈思總裁兼執行長 Victor Peng 的說法,ACAP 不僅是賽靈思自發明 FPGA 以來最卓著的工程成就,而且是一款超越 FPGA 功能的突破性新型產品。

ACAP 到底是什麼?

據悉,ACAP 歷經四年的研發,累積研發投資逾 10 億美元。首款 ACAP 產品系列,將是採用臺積電 7 奈米工藝技術開發的代號為“Everest(珠穆朗瑪峰)”的產品系列,該產品將於今年年底實現流片,於 2019 年交付給客戶。

根據官方介紹,ACAP 是一個高度整合的多核異構計算平臺,能根據各種應用與工作負載的需求從硬體層對其進行靈活修改。其核心是新一代的 FPGA 架構,結合了分散式儲存器與硬體可程式設計的 DSP 模組、一個多核 SoC 以及一個或多個軟體可程式設計且同時又具備硬體自適應性的計算引擎,並全部通過片上網路(NoC)實現互連。

此外,ACAP 還擁有高度整合的可程式設計 I/O 功能,根據不同的器件型號這些功能從整合式硬體可程式設計儲存器控制器,到 SerDes收發器技術,以及 RF-ADC/DAC 和整合式高頻寬儲存器(HBM)。

在大資料與人工智慧迅速興起的時代,ACAP 理想適用於加速廣泛的應用,其中包括視訊轉碼、資料庫、資料壓縮、搜尋、AI推斷、基因組學、機器視覺、計算儲存及網路加速等。軟硬體開發人員將能夠針對端點、邊緣及雲應用設計基於 ACAP 的產品。

軟體開發人員將能夠利用 C/C++、OpenCL 和 Python 等軟體工具應用ACAP系統。同時,ACAP也仍然能利用 FPGA 工具從RTL 級進行程式設計。

Moor Insights & Strategy 市場調查公司創始人 Patrick Moorhead 表示:“這就是未來計算的形式。我們所說的是能在幾分鐘內即完成基因組排序,而非幾天;資料中心能根據計算需求自行對其伺服器的工作負載進行程式設計調整,例如在白天進行視訊轉碼,晚上則執行影像識別。這一點意義重大。”

向英特爾和英偉達發起進攻

在釋出會上,Victor Peng 介紹了塑造賽靈思未來的三大趨勢:

  • 第一個趨勢是資料大爆炸。現在主要是隨著感測器越來越多的部署所帶來的海量視訊和影像類資料,很多資訊和資料都是散亂無序、非結構性的,因此,所需要的處理能力也是需要幾何級倍數增長。這是傳統 CPU 沒有辦法支援的。因而,我們需要全新的架構,支援更大的吞吐量、更高的時延,最好是實時的計算能力。

  • 第二大趨勢是人工智慧的黎明(Dawn of AI)。人工智慧現在還處於發展的早期階段,今後幾十年都會有非常迅速的發展,它自身並不是一個應用,而是一項能夠和很多應用相結合的技術,這項應用包括現在已經存在的應用,也包括未來將會層出不窮的新的應用。這些應用會處在端點,會到邊緣,然後再到雲。我所說的這個端點,包括一個單一的攝像頭,一個單一的感測器,它們具有人工智慧和機器學習;然後是邊緣,邊緣也有人工智慧,也有機器學習,然後再到雲端,同樣需要人工智慧和機器學習。

  • 第三個趨勢是後摩爾定律時代的計算。從很多方面來看,摩爾定律起作用的過程已經在大大放緩,這意味著下一時代的計算越來越多的需要異構性的系統,不再像以那樣只需要單一的一個 CPU,它還會需要很多的加速技術,而且也因為未來人工智慧的發展,行業會有更廣泛的應用,單一的架構已經沒有辦法來滿足針對各種不同應用進行優化的需求。

顯然,賽靈思的 ACAP 就是為了滿足未來市場的需求而研發的。

賽靈思表示,ACAP 是高度整合的多核異構計算平臺,能針對各種應用與工作負載的需求,從硬體層進行更改變化。ACAP 的靈活應變能力可支援在工作過程中以毫秒級動態調節,實現了 CPU 與 GPU 所無法企及的效能水平與單位功耗效能。

此外,Victor Peng 還明確表示,未來將以資料中心為發展新重點,以進一步推動計算加速、計算儲存及網路加速領域的創新與部署,其中包括人工智慧(AI)推斷、視訊與影像處理、基因組學等應用。

這也意味著,賽靈思已經正面向英特爾和英偉達發起了進攻。據AI科技大本營瞭解,亞馬遜、阿里、百度等都已經推出了 FPGA 雲服務平臺。

AI 晶片之爭

從賽靈思透露的資訊來看,賽靈思也瞄準了 AI 晶片市場,並且新一代的 FPGA 架構也針對深度學習演算法進行了優化。此外,賽靈思還投資了一家中國 AI 晶片公司——深鑑科技。這家公司的主要開發以 FPGA 為基礎架構,面向 AI 異構計算平臺 DPU(Deep-Learning Processor Unit,深度學習處理器)。

目前,AI 晶片架構之爭主要集中在 GPU、FPGA 和 ASIC 三者之間,每種架構的優劣如下圖所示。

目前英偉達憑藉著 GPU + CUDA,在加速神經網路訓練這一領域的統治地位依然牢固。此外,英特爾也先後收購 Altera 和 Nervana Systems 來發力 AI 晶片市場。

除了 GPU,ASIC 也是 FPGA 的競爭對手。

谷歌的 TPU 其實就是 ASIC 的一種,最新的第二代 TPU 不僅可以用於推理,還可以用於訓練,而且谷歌已經在自家的雲平臺上推出了 Cloud TPU 服務,來勢洶洶。此外,很多 AI 晶片創業公司也選擇了 ASIC 路線。

位元大陸產品戰略總監湯煒偉在接受AI科技大本營的採訪時曾表示,自己更看好 ASIC 路線。

顯然,Victor Peng 並不這麼認為。

首先我並不認為市場上只會有一種晶片的架構,我們是非常獨特的解決方案,如果我們的架構是靈活應變的,可以根據 AI 的情況進行優化,比如有一些創新型的演算法出來,所以不會是一個一統天下的局面。

我並不覺得從長期或者從廣泛的角度來講,ASIC 會成為一個可行的解決方案。它可以為某一種特定的網路進行加速,但只能維持在那樣一個水平,或者要等到下一代產品出來才可以再進行加速,所以它只能滿足市場上一小部分的需求。

因為現在充滿了變化,而且不斷的有創新在出現,如果開發了一個 ASIC 的應用,它可能只能保持這一點上是最先進的,但是之後市場再發生變化它就沒有辦法了。但是 ACAP 和 FPGA 就不一樣了,如果有不同就可以馬上優化。所以如果是根據工作負載來調整的話,很多的應用就沒有辦法來跟著這個工作負載進行調整,但是我們的這個產品就會非常的靈活應變,所以根據現在的創新狀況和佈局,固定功能的晶片是做不到的。

當然,正如清華大學微納電子系主任、微電子所長魏少軍教授在 GTIC 2018 大會上所說的那樣,目前還不存在適應所有應用的通用演算法,所以應用領域的確定是 AI 晶片發展的一個重要前提,而 AI 的殺手級應用到目前為止還沒有出現,因此 AI 晶片還有很長的路要走。

我們關心的是,在這樣一場競賽中,賽靈思能夠走多遠。

相關文章