專訪 | 英特爾收購Nervana後的第一張王牌Lake Crest,號稱比GPU速度快10倍,年底測試

AI科技大本營發表於2019-01-10
記者 | 谷磊

編輯 | 鴿子

近年來,人工智慧在經歷了兩次大的低潮後又成為科技界的大熱門,這和深度學習這個分支的勃興有很大的關係。在訓練深度神經網路的時候,人們也越發認識到,具有大的資料吞吐量,且可以平行計算的GPU比CPU擁有更快的訓練速度,更低的功耗,這一度讓CPU的王者英特爾感到異常緊張和失落。

好在,人工智慧硬體平臺爭奪的序幕才剛剛拉開。隨著時間的推移,人們很快發現相比GPU和CPU,FPGA具有的低能耗、高效能以及可程式設計等特性,十分適合感知計算,而且可以做到快速部署。2015年,英特爾便動用167億美元收購了當時全球第二大FPGA廠商Altera,也是有史以來最大的一筆收購案。

也是在那一年,憑藉擁有號稱最快的深度學習框架 neon和首個結合機器智慧軟硬體雲服務的Nervana Cloud,深度學習初創公司 Nervana 被 VentureBeat 評為值得關注的五家深度學習初創公司,次年8月,暗中觀察許久的英特爾豪擲4億美元將僅有48名員工的Nervana收入了囊中。
2017年3月,Nervana 以及其他英特爾內部的人工智慧相關業務和資源被整合進一個部門,即人工智慧產品事業部(AIPG),由Nervana的聯合創始人、前CEO Naveen Rao來領導,直接向英特爾CEO科再奇彙報。
專訪 | 英特爾收購Nervana後的第一張王牌Lake Crest,號稱比GPU速度快10倍,年底測試
據AI科技大本營瞭解,在整合了 Nervana 的技術之後,英特爾AIPG 計劃推出 Crest 家族系列產品線。首先亮相的是一款叫做 Lake Crest 的晶片,它是專為訓練DNN而深度定製的ASIC解決方案,預計今年下半年測試,2018年上市。據 Naveen Rao 曾經對媒體介紹,相對於目前最快的GPU, Lake Crest的加速效能是它的10倍。

在近日英特爾舉辦的人工智慧端到端技術研討會上,英特爾AIPG資深首席工程師Andres Rodriguez介紹了英特爾在AI方面的技術佈局、產業趨勢以及Nervana系列晶片的進展情況。

專訪 | 英特爾收購Nervana後的第一張王牌Lake Crest,號稱比GPU速度快10倍,年底測試
英特爾AIPG資深首席工程師:Andres Rodriguez

據Andres Rodriguez介紹:Lake Crest 使用了Flexpoint架構,MCM多晶片封裝,搭載32GB HBM2儲存,內部互聯速度是PCIe的20倍。

會後AI科技大本營記者對Andres Rodriguez進行了專訪。

Andres透露,Lake Crest 的測試時間之所以從2017年的上半年推遲到了下半年,是因為Nervana在被intel整合後,其產品的質量需要滿足英特爾平臺的高標準,所以他們新增了一些額外的驗證,這或多或少的會影響產品開發的速度。

在被問到目前的工作狀態和Nervana被收購前有何不同時,Andres表示他們的工作模式其實並沒有發生特別大的變化,仍保持著一個初創企業勇往直前的狀態。 只是由於被英特爾收購後,客戶的期待變得更高,壓力也更大了。

寫到這裡正準備截稿,AI科技大本營記者在9月12日南京政府主辦的中國人工智慧峰會上邂逅了曠視科技的首席科學家孫劍博士,當被問及2018以後會不會在訓練時考慮Lake Crest晶片這個問題,孫博士表示可能會吧,但硬體平臺那麼多不可能每家都去試,言下之意是畢竟公司已經和英偉達深度合作了,所以……

深度學習晶片的架構能否被英特爾重新定義需要到2018年才能驗證,而在Lake Crest上市後,如何改變使用者的使用習慣也是需要英特爾好好思考的問題。
專訪 | 英特爾收購Nervana後的第一張王牌Lake Crest,號稱比GPU速度快10倍,年底測試
Andres Rodriguez接受AI科技大本營記者專訪
以下為Andres Rodriguez的採訪實錄,AI科技大本營做了不改變原意的整理:

       關於Nervana系列晶片:Lake Crest年底測試,2018年量產

AI科技大本營:Nervana系列晶片的定位是什麼,它和GPU相比有什麼不同?

Andres Rodriguez:首先,我想簡單介紹一下英特爾Nervana人工智慧平臺,作為我們的NPU,它是Crest家族產品。

與GPU相比,其實主要有兩點不同:

  • 第一個不同點是作為整個Nervana AI平臺,Lake Crest是為了深度學習而量身定製的,因此它本身並沒有內建影像顯示卡,換句話說它並不支援相關影像的處理,這是跟GPU很大的不同之處。

  • 第二個重要的不同在於它的計算能力包括效能上都是針對深度學習而進行的量身優化。

當然,也有一些相似之處,比如整個Crest家族產品來講,包括市面上一些最新的晶片產品,都是擁有高寬頻記憶體,不用通過CPU就可以進行整個晶片之間包括核心之間的直接互聯。

同時整個Nervana AI平臺是為了深度學習而量身打造的,那麼不管是硬體平臺還是軟體平臺都可以達到一個很好的整合。

AI科技大本營:我經常聽到有關媒體提到Nervana晶片在深度學習訓練方面,比GPU擁有更強的加速。可否針對性的談一談在計算速度和計算力這些方面它的具體效能是什麼。

Andres Rodriguez:我們產品整個詳細的細節目前只對簽了保密協議的客戶開放,具體內容到今年年底才能公開。效能或是功耗提升具體的數字我暫時不能透露給您。但是可以說的是,與其他系列產品相比,我們利用度是非常高。

AI科技大本營:說起Lake Crest上市或者測試的時間,之前有訊息稱應該是在今年上半年,但是為什麼推遲到下半年,中間是遇到了什麼困難嗎?

Andres Rodriguez:因素是多方面的,其中有一個最主要的原因是在英特爾進一步的整合Nervana平臺之後,對於Nervana晶片必須進行更加嚴格的測試,才能讓它更好的滿足英特爾目前對晶片質量的要求,同時也能夠滿足英特爾在全產品質量以及全平臺系列的高標準。 正是基於這一個要求,我們必須要做很多的測試工作。

AI科技大本營:Lake Crest或者是Crest家族的晶片是如何支援像Caffe、Torch、TensorFlow這些比較流行的人工智慧框架?

Andres Rodriguez:不管是Lake Crest、至強還是Movidius、FPGA,我們對其他框架提供支援的方式,整體流程都是比較一致的。

首先使用者會把自己的模型寫入他所替代的框架當中,在整個框架底部會有專門針對深度學習所打造的內容庫,針對不同的內容庫我們會對架構進行優化。

這裡我可以拿TensorFlow舉個例子,TensorFlow有一個量身定製的演算法,同時至強處理器、FPGA都有專門的單元庫。不管你使用的哪個框架、哪種不同的硬體,我們都會針對具體內容對它的單元庫進行優化,整個的方法相對來講是比較一致的。

AI科技大本營:Crest家族的晶片適用於哪些具體的應用場景?

Andres Rodriguez:整個Crest晶片家族的系列產品,都是針對深度學習不同型別的負載而打造的,不管是之前所說的物品檢測、物體識別,同時還有視訊處理、影像識別、影像處理,還有語音處理、自然語言的處理。整個深度學習的通用功能都是非常支援的,這都是它所適用的領域。

除此之外還有訓練和推理,以及在資料中心當中的使用,也是Crest系列家族產品所支援的。同時,具體的應用領域還是很廣泛的,不管是像現在的基因測序、金融領域以及自動駕駛領域,Crest系列的產品都可以使用;同時它的訓練模型取決於具體的環境,我們也可以把它用在推理過程中,包括資料中心,如果你要做推理,我們的Crest家族系列產品也是可以支援的。

AI科技大本營:如果現在你自己有一個訓練神經網路的需求,你會怎麼為自己選擇一款晶片呢?

Andres Rodriguez:其實不管像我自己還是現在很多市面上的客戶,可能都是跟我處在一樣的情況中,就是有大量可用的至強處理器去考慮。在這種情況下,我可能不需要特意買其他的專門為深度學習打造的硬體,因為在至強處理器上可以完成所有的工作。

對比六個月之前,我們的效能已經提高了一百多倍,所以我們沒有必要考慮其他的解決方案。另外在整個訓練的過程當中,我的工作負載所需要的時間可以大幅度的縮短,在處理深度學習訓練過程中,所有的工作負載是被分佈到不同的核上同時完成的,這個可以大量的降低時間。

AI科技大本營:你剛才提到Lake Crest是在今年年底釋出,中國市場和美國市場同步嗎,都是在同一時間拿到產品?

Andres Rodriguez:作為Lake Crest具體的矽片的話,今年年底我們會公佈具體的細節。但實際的投產包括大規模的量產還是要等到2018年上半年。作為整個Lake Crest,會整合在Nervana Cloud當中,客戶在Nervana Cloud對它進行測試。我們一些非常緊密的合作伙伴,不管是美國還是中國的,都可以直接在Lake Crest進行測試。

當然,我們具體的測試也是分成兩個不同型別的合作伙伴群體。對於有大量需求的客戶,我們是隻對一些合作非常緊密的合作伙伴開放,他們可能考慮會在未來把我們的Crest部署在他們的資料中心。如果作為一個通用的測試,那麼開放範圍會更加廣一點。

AI科技大本營:未來AIPG在AI晶片技術方面的計劃是什麼樣的,或者有沒有一個產品路線圖?

Andres Rodriguez:答案是肯定的,路線圖我們有一個既定的規劃,除了傳統的計算以及訓練和推理之外,我們還會建立起更加完善的深度學習生態系統的規劃。 但是我們關注的並不僅僅是訓練以及推理本身,我們還有其他很多的詳細產品的規劃,但具體的內容包括細節我們只會跟我們簽署了保密協議的客戶去分享。

           關於AIPG目前的情況:團隊相比之前的Nervana有了很大擴張

AI科技大本營:關於你個人的工作狀態,因為現在Nervana剛被英特爾收購,現在你在英特爾或者在AIPG工作的狀態跟原來在Nervana的時候有什麼不同嗎?

Andres Rodriguez:可以說目前為止英特爾人工智慧產品事業部的整個領導層跟我們之前Nervana 系統沒有什麼太大的變化。 我們現在的GM也是整個英特爾的VP,是我們之前Nervana System的前CEO,也是之前Nervana的聯合創始人。

Nervana現在已經被英特爾收購併且加入到了AIPG事業部,我們依舊秉承了之前作為一個初創企業的勇往直前的精神。 我們的工作模式其實並沒有發生特別大的變化。我們還是希望快速的完成產品研發,並且非常專注於我們所擅長的領域。

其中一個最大的區別,就是我們的規模明顯比之前Nervana要大得多,但是很多的傳統還有一些價值理念都被很好的傳承了下來。還有另外一個重要的不同之處,畢竟整個人工智慧產品事業部是有英特爾大品牌作為一個重要的背景支撐,而客戶對我們後續的產品將會有更高的期待。 不管從效能還是安全的角度來講都是如此,這對我們來講也是一個巨大的壓力,也就是說加入英特爾之後,必須要有一個更高的標準來開發我們的技術和產品。

除此之外,我們要開發出更好的產品,產品的質量、標準和要求都會更高,這對我們來講也是額外挑戰的,為了滿足高標準高要求, 我們要新增一些額外的驗證或者工作,這可能或多或少的會影響我們產品開發的速度,這也是我們必須要做出是一個妥協。

AI科技大本營:剛才說團隊有一個很大的擴張,因為在Nervana被收購之前,我記得有48個人,現在你們團隊有多少個人?

Andres Rodriguez:我們的規模肯定要比之前大得多了,但是具體的員工數量暫時不方便透露。 我覺得加入英特爾對我們來講一個非常巨大的優勢就是儘管之前Nervana也是人才濟濟,但畢竟人數比較少;而現在在整個英特爾平臺之下,硬軟體包括數字科學家們,我們能接觸到的專家越來越多,這將是一個最大的優勢。

同時,我們的全球市場也更大,視角更開闊。 因為在整個AIPG我們不僅僅關注Lake Crest加速器、Nervana系統,我們還有一個更大的市場。

舉個例子,我們與谷歌TensorFlow的優化就是在整個AIPG事業部帶領下實現的,所以說AIPG有一個更大的市場。

                                 對中國AI晶片公司的看法

AI科技大本營:請問你如何看待中國本土的AI晶片?

Andres Rodriguez:我覺得在現在整個市場百花齊放,讓每個企業都有自己的選擇空間,這是一個非常利好的事情。因為在整個生態系統之內,各相關方都可以互相學習,並且能夠推動整個深度學習領域的快速發展,所以說我們也是非常高興和歡迎這一個市場的發展與進步。我們也是希望能夠有機會與中國企業包括與更多的客戶去充分合作,能夠共同的開發針對深度學習領域的軟體、硬體以及其他產品。

相關文章