在「古板遲緩」的晶片產業,一群「寒武紀」們誕生的意義與挑戰

微胖發表於2017-11-06

撰文 | 宇多田

在過去的幾年裡,一個名為「深度學習」的人工智慧技術家族在科技行業掀起了一場風暴。

從幫你對手機相簿裡的自拍與萌寵進行識別分類,再到大幅度提高 Alexa 們(智慧助手)與無人駕駛汽車的「平均智商」,「深度學習」這個人工智慧裡的門類,具備了更高階的對「複雜結構」進行自動挖掘的能力。

通俗來說,與傳統計算通過固定流程解決「確定」問題不同,深度學習演算法需要模擬人腦來解決那些取決於概率的「不確定問題」。

而這個解決問題過程所需的算力,卻與傳統晶片所擅長的不一致。

因此,各類終端,乃至整個智慧硬體市場,對底層基礎晶片的要求也發生了根本改變。簡單來說,就是處理器效能與需求之間出現了巨大的市場缺口。

而這正是為何從英偉達、英特爾等老牌半導體巨頭,再到 Cerebras Systems、Wave Computing 等明星AI 晶片初創公司,都在競相開發供 AI 演算法專用的晶片。

從某種意義上,這些晶片能夠根本改變計算機的製造方式。

而在這些恰逢其時出現的idea與創業公司中,就包括最近風頭正勁的全球第一家晶片獨角獸——中國創業公司「寒武紀」。

「寒武紀」們的機會

當下,在很大程度上,深度學習晶片市場是由英偉達主導的。

這家晶片巨頭長期以來一直以其「王牌產品」——圖形處理器(GPU)而聞名業界。而 GPU 有成千上萬個並行的微型計算機,每個都在「專心」地渲染畫素。

通常,為了渲染影象的陰影、光線、反射以及透明度,這些小的計算「核心」需要一起執行大量低階的數學運算。

而就在幾年前,研究人員又發現,GPU 的功能理論上非常適合執行深度學習演算法,因為後者也需要成千上萬地平行計算,正迫切需要一款適合的晶片來高效計算深度學習任務。

而這一發現,讓 GPU 的出現顯得恰逢其時,也讓英偉達成功成為人工智慧革命的「核心發起人」之一。

不過,雖然這些 GPU 在遊戲和其他影象密集型應用中被廣泛使用,但是從英偉達近年來的財報可以看出,資料中心的業績雖然增幅很大,但從GPU在人工智慧領域的整體情況來看,並不是非常理想。

特別是2017年第一財季,這項業務同比增長了186%,佔總營收的20%。

在「古板遲緩」的晶片產業,一群「寒武紀」們誕生的意義與挑戰


而在智慧終端晶片市場,英偉達並不是明顯的贏家。

換句話說,終端市場中的各種垂直場景,包括手機、智慧家居、安防、自動駕駛等領域,都存在 AI 晶片創業公司切入的大量機會。

在「古板遲緩」的晶片產業,一群「寒武紀」們誕生的意義與挑戰

(請注意,遊戲領域並不算是GPU在人工智慧領域的應用)

而另一個讓創業公司「有利可圖」的理由,在於通用晶片與專業晶片的差異性。同花順財經對這個「差異性」有一個非常形象的比喻:

GPU 是一種通用型晶片,就像是你買了一個格局都固定了的房子,然後改變內部的軟體設施來讓這個房子達到我們需要的功能,優點是對於使用者代價小,但肯定沒法達到效能最大化。換句話說,就是計算力有限,效能不夠。

而專業性的 ASIC 晶片,譬如嵌入華為麒麟 970 晶片的寒武紀 1A 處理器,就像是完全一塊磚一塊磚按自己需求重新搭建一個房子,這種肯定在效能上最貼近我們的需求,但是一次性投入太大,如果不是某一確定需求,或者能夠有足夠大的市場規模,肯定要冒風險。

在「古板遲緩」的晶片產業,一群「寒武紀」們誕生的意義與挑戰


從目前來看,雖然 GPU 的效能已經大大高於傳統的 CPU,但是對於功耗較小的終端裝置(譬如手機)來說,GPU 的計算力可能仍然不能滿足一些需要高效運算的 AI 應用。

因此,一種目前許多終端公司與研究機構在採用的解決方法是,通過硬體加速,採用專用協處理器的異構計算方式來提升處理效能。通俗點來說,就是通用與定製化晶片可以「共存」在一個終端裡。

以華為 Mate10 為例,其麒麟 970 晶片的 HiAI 移動計算架構就是由 CPU、GPU、ISP/DSP 和 NPU(寒武紀 1A 處理器)四部分組成。

Mate10 上的一款微軟翻譯 app,就是基於 NPU 的強大運算效能,將翻譯速度提升了 300%,還能實現離線可用的全神經網路機器翻譯。

因此,對於晶片創業公司來說,做的「更專」,針對特殊場景和需求進行更多特別的設計,反而是在這個市場進行「彎道超車」的好選擇。

在「古板遲緩」的晶片產業,一群「寒武紀」們誕生的意義與挑戰


目前,從全球來看,大多數晶片創業公司,都是選擇了先設計並製造「定製化晶片」的方式來切入市場。

譬如由一群具有傳奇色彩的美國晶片業老兵 Andrew Feldman 等人在 2016 年成立的深度學習晶片製造商 Cerebras,就是這樣一家公司。

雖然其研發及主體業務一直處於祕密狀態,但據訊息人士透露,他們的晶片就是為「訓練某些 AI 演算法模型」而量身定製的。

像 Cerebras 這樣的晶片創業公司們相信,自己完全有能力在深度學習應用程式中構建一些優於 GPU 的晶片。作為 Cerebras 的 CEO,Feldman 曾在一次採訪中指出,GPU 只是用來生成圖形的:

「我不認為 GPU 適用於深度學習,」費爾德曼表示,「它可能比英特爾的 (CPU) 要好,但 GPU 只是代表了一種 25 年來傳統晶片針對不同問題的優化結果。」

而許多其他正在崛起的 AI 晶片公司基本都在遵循著 Feldman 的邏輯:他們設計的下一代晶片有著「多核心」的特色,而每個核心都是針對低精度運算。

譬如總部位於加州坎貝爾市的創業公司 Wave Computing,就在最近披露了自己晶片架構的細節——他們在一個被稱為「WDPU」的晶片上有 16000 個核心。

而另一家總部位於英國布里斯托的晶片創業公司 Graphcore 則表示,其名叫的 IPU 的晶片上載有 1000 多個核心。

在「古板遲緩」的晶片產業,一群「寒武紀」們誕生的意義與挑戰


再轉向國內,作為全球唯一一家晶片獨角獸,誕生於中國科學院計算技術研究所,成立於 2016 年的寒武紀,早在去年就推出了一款名為「1A處理器」的商用深度學習專用處理器(NPU)(神經網路處理器)。

而最值得注意的是,這塊具備了傳統四核CPU25倍以上效能的專用晶片,主要針對計算機視覺、語音識別等方面的任務。

另外,在今天舉行的寒武紀釋出會上,CEO 陳天石宣佈在 2017 年 3 季度上市的寒武紀 1H8 處理器,主要面向場景視覺的應用;而上市時間「保密」的寒武紀 1M 處理器,則主要面向智慧駕駛領域。

總體來說,寒武紀現有以及即將上市的晶片旗艦產品,都只針對一些特定的垂直場景,且執行智慧演算法時的效能與計算效率,都要大幅超越 CPU 與 GPU。

在「古板遲緩」的晶片產業,一群「寒武紀」們誕生的意義與挑戰

晶片創業公司的驕傲與挑戰

毫無疑問,這個產業的投入非常龐大,而且資金必須可持續。就像 ARM 中國戰略發展總監袁偉的表述一樣:「晶片研發與製造的投入必須要達到 10 億美金的級別,基本上只有巨頭能擔負得起」。

但很顯然,資本似乎對這種「費錢」的現實「無動於衷」。

因為從某種程度上,英偉達如今瘋狂飆升至 1000 億美元的市值對投資者們產生了極大的衝擊,沒有人不對 AI 晶片在商業領域展現出的想象空間垂涎欲滴。

這種意識讓投資者在面對 AI 晶片創業者時並沒有捂緊錢包,當下,資本正在源源不斷地流入這個「又見生機」的古老產業。

以剛剛提到的神祕晶片創業公司 Cerebras 為例,根據資本資料庫 PitchBook 提供的融資檔案顯示,在其結束的三輪融資中,Cerebras 已經籌集了 1.12 億美元,其估值也在今年8月飆升至高達 8.6 億美元。

而 Wave Computing 與 Graphcore 迄今為止也分別籌集了 6000 萬美元。投資者們包括 DeepMind CEO Demis Hassabis,Uber 首席科學家 Zoubin Ghahramani 以及一些來自 OpenAI 的管理層。

「我們剛剛宣佈成立 AI 晶片公司,就被那些對我們產品感興趣的人的電話打爆了,」Graphcore 的執行長兼聯合創始人奈傑爾·圖恩 (Nigel Toon) 的這番說法既無奈又驕傲,「我們甚至可以和任何 AI 領域的關鍵人物進行溝通和談判。」

而剛剛釋出了新產品的寒武紀,也是在今年 8 月份獲得 1 億美元 A 輪融資金額,晉升為全球首個晶片獨角獸後,開始受到國內的廣泛關注。值得注意的是,阿里巴巴、聯想等計算巨頭都是其重要投資方。

在「古板遲緩」的晶片產業,一群「寒武紀」們誕生的意義與挑戰

寒武紀CEO陳天石


更大的投入與回報,更令人興奮的市場,自然也湧動著更大的危險與挑戰。

福布斯雜誌就曾對這個不斷砸錢的市場發出疑問:適合這些晶片的硬體真的成熟了嗎?

以無人駕駛汽車為例,大部分零部件仍處於開發階段與早期試點階段。

還有就是,即便你花費數年時間研發出一款晶片,但是否能夠適應演算法及硬體變遷的節奏呢?

特別是對於定製化的 ASIC 晶片來說,演算法是固定的,一旦演算法變化就可能無法使用。目前人工智慧還屬於大爆發時期,大量演算法不斷湧出,遠沒到演算法平穩期,ASIC 專用晶片如何做到適應各種演算法是個最大的問題。

因此,像寒武紀這樣的公司,雖然以一款深度學習專用晶片為切入點,但公司顯然已經在朝著製造更通用晶片的道路邁進了。

譬如,今天寒武紀也在最後順延推出了一款面向雲端的機器學習處理器 MLU,而陳天石也在接受採訪時否認了寒武紀是一家制造 ASIC 晶片的公司:

「我們不只有神經網路處理器 ,還會在未來發布適用於更多工的處理器產品。」

在「古板遲緩」的晶片產業,一群「寒武紀」們誕生的意義與挑戰

可以看到,MLU涉及了資料中心業務

此外,雖然英偉達讓人們看到了 AI 晶片的巨大商機,但我們從目前來看根本不清楚晶片創業公司的商業機遇究竟有多大。

儘管有英偉達在先,但通過晶片產品進入以計算為基礎的資料中心市場仍然是一個不容忽視的大目標,因為這是一個隨著雲端計算產業爆發而變得十分有利可圖的市場。

但這一市場基本被亞馬遜、谷歌、微軟、蘋果、Facebook 等美國計算巨頭所主導。而谷歌也因為 GPU 的功耗問題,開發了屬於自己的 AI 晶片 TPU;微軟也似乎正在專注使用一種叫做 FPGA 的可程式設計晶片。

在「古板遲緩」的晶片產業,一群「寒武紀」們誕生的意義與挑戰


而另一個明顯的挑戰,在於晶片創業公司獨立成長壯大的「高難度」。

在過去幾年中,半導體行業經歷了大規模的併購整合浪潮,所有晶片巨頭對待新事物都十分警惕——在積極尋找下一個可以賺錢的「Big Thing」同時,也在把「一切威脅地位的苗頭」無形扼殺於搖籃裡。

可以看出,他們大多數的收購目標都瞄準了專注於人工智慧計算與自動駕駛等場景的專業級公司。特別是晶片巨頭英特爾,其併購套路一直是極具「侵略性」的:

  • 耗資 187 億美元收購 FPGA(可程式設計晶片)製造商 Altera;
  • 花 150 億美元買下自動駕駛系統製造商 Mobileye;
  • 花 3.5 億美元收購深度學習技術公司 Nervana。

而英特爾的競爭對手高通,正試圖以 380 億美元的價格,與在汽車市場具有絕對話語權的晶片製造商 NXP 進行合併。

高通創投的 CEO Quinn Li 曾透露,公司其實已經研究了像 Cerebras 這樣的 AI 晶片公司很長時間,但是因為一些不確定因素還沒有進行下一步動作。

「尤其是在供資料中心使用的晶片市場,我們還尚未進行任何投資。每個人都很明白,

在資料中心領域的潛在客戶數量有限,而進入一個由英偉達把控的市場會非常困難。而在終端裝置領域,由於硬體還不是很成熟,市場規模還遠遠沒有達到想象的樣子。」

他坦白,高通也正在試圖弄清楚市場機會是什麼。「最賺錢的仍然是資料中心領域,或許亞馬遜和其他沒研發 AI 晶片的大公司會對更新,價格更低效能更好的產品感興趣。」

在「古板遲緩」的晶片產業,一群「寒武紀」們誕生的意義與挑戰

在「古板遲緩」的晶片產業,一群「寒武紀」們誕生的意義與挑戰

(以上為寒武紀的商業目標)


從寒武紀的產品角度來看,與國外同類創業公司相比,這家中國晶片創業公司已經率先進入了商業化流程——其 IP 指令集,已擴大範圍授權整合到手機、安防、可穿戴裝置等終端晶片中,截止 2016 年已拿到 1 億元訂單。

不過,寒武紀另一個突出優勢在於有著「國家戰略」的支援,其「中國芯」的宣傳口號與國家科技部門對公司進行的專題調研以及學院背景就可見一斑。

但無論如何,你不能否認的是,在這個古老且傳統的半導體產業中,AI 在晶片上的突破與寒武紀們的出現,是徹底改變傳統市場「賽制」,進行市場洗牌,與加速 AI 產業化的重要機會。

相關文章