如被稱為國內“AI四小龍”之一的依圖科技就憑藉在計算機視覺、語音識別、語義理解和智慧決策等多方面的技術積累,將人工智慧技術注入到了智慧安防、科技金融、智慧醫療、智慧城市、新零售和智慧製藥等多個領域,推出了全球領先的創新技術和產品。人工智慧應用也在依圖等廠商的的推動下迅速發展,這也帶動了後面相關晶片需求的發展。
根據Gartner的預測資料,全球人工智慧晶片市場規模將在未來五年內呈現飆升,從2018年的42.7億美元成長至343億美元,增長超過7倍。相關的晶片也從早期的CPU、GPU、FPGA發展到現在針對特殊應用開發的客製化AI晶片。尤其是後者,更是成為最近這些年產業不可逆轉的潮流。
從GPU、FPGA到專用AI晶片的演變
在人工智慧的發展早期,市場上都是選用CPU、GPU和FPGA等晶片作為人工智慧應用的“動力”來源,但隨著終端市場的發展,這些晶片的瓶頸開始凸顯:
如CPU雖然能夠為人工智慧提供適合的算力、價格、功耗和時間,但因為AI的許多資料處理涉及矩陣乘法和加法,這並不是CPU所擅長的;GPU方面,雖然他們也是為了應對影象處理中的大規模平行計算處理而生的,但因為其硬體結構方面的侷限性,使得即使他們在人工智慧訓練端如此重要,也還是有不少廠商嘗試尋找新的替代空間;FPGA也因為基本單元的計算能力有限,速度和功耗方面也略顯不足,再加上價格昂貴,在市場上也頗受爭議。於是擁有成本、效能和功耗等優勢的專門定製AI晶片就開始成為了市場追逐的目標。
這不但推動了一大波初創公司的誕生,很多做軟體和演算法的公司也都先後投身其中。
在前者方面,國內的寒武紀、地平線和位元大陸都是先鋒。以寒武紀為例,他們在2016年推出了世界首款終端人工智慧專用處理器“寒武紀 1A”處理器,並已應用於數千萬智慧手機中。2018年,寒武紀推出了MLU100機器學習處理器晶片。按照他們的說法,這個昔年的執行主流智慧演算法時效能功耗比全面超越CPU和GPU。他們新一代的晶片最近也將浮出水面。
後者方面,谷歌和亞馬遜是當中的先行者。據谷歌介紹,他們設計的、專門用於神經網路工作負載的矩陣處理器TPU可以極快地為神經網路處理大量的乘法和加法運算,並且耗電量顯著降低,佔用的物理空間更小。更重要的一點是通過其脈動陣列架構設計大幅度緩解了馮·諾依曼瓶頸;亞馬遜AWS部門也通過其定製設計的機器學習推理晶片Inferentia為客戶提供數百 TOPS(每秒萬億次運算)推理吞吐量,以允許複雜模型能夠進行快速預測。能以極低成本交付高吞吐量、低延遲推理效能。
對於前者來說,因為AI市場潛力巨大,他們做晶片去分一杯羹無可厚非。但對於後者來說,這當中的意義更是巨大。一方面是因為他們擁有了龐大的客戶,加入了自研晶片無疑可以降低他們的成本。另一方面,自研的AI晶片在效能和功耗上也有很大的提升空間,廠商甚至可以做一些差異化的設計,提高其競爭力,這也是那麼多系統廠商進入這個市場的原因。
依圖科技則是這個市場的另一大玩家。
人工智慧“老兵”的新疆界
和現在的一大波人工智慧的新玩家相比,成立於2012年的依圖科技是不折不扣的老兵。在創始人朱瓏博士和林晨曦的領導,以及公司員工的腦力下,依圖科技在人臉識別、語音識別等多個領域積累了深厚的技術,公司也在多個市場攻城拔寨。這也幫助公司在一輪輪融資中,把市值推高,也讓公司創始人有底氣說出了”我們很貴,別人買不起“這樣的豪言。
而這個主打機器視覺,以“擴充人工智慧新疆界”為Slogan的企業不滿足於此,他們正在橫向和縱向擴充他們的疆界,而晶片就是他們的目標。按照依圖的想法,把握住高整合度, 坐上資料、演算法、算力這三駕馬車,順利走好AI晶片這條道路,這就是他們的目標。
基於此,依圖釋出了雲端深度學習推理定製化SoC晶片questcore™。
據介紹,依圖科技的這款專為計算機視覺領域分析任務推出的晶片是基於自研的晶片架構打造的,它能高效適配各類深度學習演算法(包括TensorFlow、PyTorch 等主流深度學習框架),在保持極低功耗的同時能大幅提升計算力,模型相容性好,可擴充套件性高,無縫接入現有生態。
另外,questcore™自帶的網路支援模組以及對虛擬化和容器化的支援,能將AI雲的彈性計算和排程提升一個量級,這可以帶來能耗比的大幅提升。能夠充分發揮依圖世界級演算法優勢。依圖方面強調,在同等功耗下,他們的questcore™晶片能提供市面現有同類主流產品 2~5 倍的視覺分析效能。
為了實現其“極智”目標,依圖方面強調,他們從現在開始會在AI晶片和智慧硬體垂直髮力。
按照依圖的瞭解,在“演算法定義晶片”的時代,演算法即晶片,以 AI 為中心來思考架構能為晶片設計帶來無限的想象空間,而演算法則成為在這廣袤空間中探尋搜尋的指南針,擁有該領域知識的頂級演算法廠商在智慧晶片和智慧計算革命中開始發揮舉足輕重的作用。
又因為依圖 questcore™作為伺服器晶片可以獨立使用,有助於完善中國IC產業生態。這對於國內的人工智慧產業乃至整個積體電路產業來說,也是一大幸事。
依圖此次也同時釋出了基於questcore™打造的原子伺服器,一臺伺服器提供的算力與 8 張英偉達P4卡伺服器相當,而體積僅為後者的一半,功耗不到20%。這意味著,這樣一臺單手可持的小小伺服器,就能驅動一條主幹道、一整個小型園區所需的智慧算力。
依圖方面進一步指出,questcore™與依圖世界級演算法結合,構成軟硬體一體化的多元產品和豐富解決方案,將依圖研發團隊的先進演算法和工程團隊在智慧安防、智慧醫療、智慧零售和 AI CITY 等多個人工智慧行業應用場景的實踐經驗相結合,能為客戶實現更大價值。
未來無限美好,但仍需謹慎
積體電路是 20 世紀最偉大的發明,而人工智慧則是 21 世紀人類的希望。從依圖看來,在沒有先例可循的智慧時代,中國人工智慧創業公司與世界巨頭站在同一起跑線上,完全有機會成為新時代全球領先的全棧智慧解決方案提供商。依圖將立足“演算法+晶片+資料智慧”的極智戰略,深入行業,降低人工智慧應用落地和推廣成本,賦能行業,長期持續地為社會做出積極貢獻,與合作伙伴一起,共同推動中國智慧產業發展,構建融合創新的智慧生態。
但我們也應該冷靜看到,在全民歡呼背後,還有一些問題值得我們關注。就拿AI晶片領域來說,杜克大學教授陳怡然在之前曾提到,AI晶片在設計方面這幾大挑戰:
杜克大學教授陳怡然就曾提到,AI晶片在設計方面有幾大挑戰:
第一是大容量儲存和高密度計算,當神經深度學習網路的複雜度越來越高的時候,引數也會越來越多,怎麼處理是一大難題;
第二個挑戰是要面臨特定領域的架構設計,因為場景越來越豐富,這些場景的計算需求是完全不一樣的。怎麼樣通過對於不同的場景的理解,設定不同的硬體架構變得非常重要;
第三個挑戰是晶片設計要求高,週期長,成本昂貴。從晶片規格設計、晶片結構設計、RTL設計、物理版圖設計、到晶圓製造、測試封裝,需要2到3年時間,這段時間裡軟體會快速發展,演算法也在快速更新,晶片如何支援這些更新也是難點;
第四個挑戰是架構及工藝。隨著工藝不斷的提升,從90奈米到10奈米,邏輯門生產的成本到最後變得飽和。也許在速度、功耗上會有提升,但單個邏輯生產的成本不會再有新的下降。這種情況下如果仍然用幾千甚至上萬個電晶體去做一個比較簡單的深度學習的邏輯,最後在成本上是得不償失的;
雖然依圖在軟體和演算法領域獨步天下,他們這些軟硬結合的想法也能讓人遐想連篇,但對於在晶片這個全新領域,依圖還是新兵,未來即使商機無限,但也困難重重。
但正如依圖科技創始人朱瓏所說:“科技進步極大降低了創新所需的經濟門檻,但是偉大所需的精神門檻——勇氣,從來沒有降低過”。換句話說,為理想,沒有什麼不可以。