清華電子系明星公司亮相:釋出國產AI算力平臺,公測免費送百億Token

机器之心發表於2024-04-01
3月31日,由清華大學電子系主任汪玉作為發起人的AI infra公司無問芯穹在上海召開第一次產品釋出會。機器之心此前獨家介紹過,無問芯穹團隊的目標是利用自己加速計算的核心產品優勢,降低算力成本,與算力中心合作,整合算力資源,為算力市場提供增量,最終向B 端和 C 端開發者提供可以直接排程的低成本算力。

在這次釋出上,無問芯穹團隊正式釋出“無穹Infini-AI”大模型開發與服務平臺,並宣佈自3月31日起正式開放全量註冊,給所有實名註冊的個人和企業使用者提供百億tokens免費配額。開發者可以在這個平臺上體驗、對比各種模型能力和晶片效果,透過簡單拖拽各種引數按鈕的動作,就能精調出更貼合業務的大模型並部署在無穹Infini-AI上,再以非常優惠的千token單價向使用者提供服務。

清華電子系明星公司亮相:釋出國產AI算力平臺,公測免費送百億Token


目前,無穹Infini-AI已支援了Baichuan2、ChatGLM2、ChatGLM3、ChatGLM3閉源模型、Llama2、Qwen、Qwen1.5系列等共20多個模型,以及AMD、壁仞、寒武紀、燧原、天數智芯、沐曦、摩爾執行緒、NVIDIA等10餘種計算卡,支援多模型與多晶片之間的軟硬體聯合最佳化和統一部署。第三方平臺或自定義訓練、微調而來的模型也可以無縫遷移託管到無穹Infini-AI,並獲得細粒度定製化的按token計費方案。

由清華電子系主任汪玉發起

無問芯穹公司註冊於今年 5 月,核心團隊從 3 月份開始組建,發起人為清華大學電子系主任汪玉教授,創始人夏立雪是汪玉教授所帶的第一任博士畢業生。其餘兩位聯合創始人分別是原商湯科技資料與計算平臺部執行研究總監顏深根,以及現任上海交通大學長聘教軌副教授,清源研究院人工智慧設計自動化創新實驗室負責人戴國浩。

清華電子系明星公司亮相:釋出國產AI算力平臺,公測免費送百億Token

無問芯穹是汪玉教授參與發起的第二家公司,成立之初便備受關注。汪玉是清華大學電子工程系長聘教授、系主任,IEEE Fellow,ACM FPGA技術委員會亞太地區唯一成員,長期從事智慧晶片、高能效電路與系統研究。

2016年,汪玉曾以智慧財產權轉化入股,和他的學生姚頌、單羿等人共同創立AI晶片公司深鑑科技。深鑑科技推出了人臉檢測識別模組、人臉分析解決方案、影片結構化解決方案、ARISTOTLE架構平臺等六大AI產品,2018年被被賽靈思(Xilinx)收購。

清華官網資料顯示,深鑑科技是中國人工智慧行業風投退出第一單,也是清華有規定以來第一家科技成果作價入股、產品化、實現現金回報的公司,以及極少數國外科技公司收購中國科技公司的案例。

無問芯穹的創始團隊35%以上來自清華大學。創始人夏立雪在清華大學畢業後,曾加入阿里雲,在阿里雲負責過大語言模型的壓縮加速、生成式 AI 模型晶片等核心戰略專案。

夏立雪長期致力於深度學習系統的設計方法學研究,入選 AI2000 人工智慧全球最具影響力學者榜單,以及史丹佛學科 Top2% 科學家榜單。聯合創始人及 CTO 顏深根畢業於中科院軟體所,是國內最早從事 AI 高效能運算的科研人員之一,商湯任職期間,幫助商湯搭建了兩萬片 GPU 的大規模高效能 AI 計算平臺,並主持開發了多個深度學習系統軟體。另一位聯合創始人及首席科學家戴國浩在電路設計自動化、異構計算、體系架構等領域發表高水平論文 50 餘篇,谷歌學術引用超千次。承擔包括國家自然科學基金青年專案在內的多個縱橫向專案,個人負責經費超千萬元。

2023年12月份的專訪中,夏立雪曾告訴機器之心,無問芯穹團隊成員已經超過100餘人,團隊仍在快速擴張。公司成立半年內,已經完成數億元融資,投資人包括百度、騰訊和智譜等戰略合作方,以及徐匯資本、紅杉中國、Monolith、啟明創投、北極光創投、經緯創投、真格基金、金沙江創投、SEE Fund和綠洲資本等投資機構。

啟用更多有效算力,已在10+種晶片上實現SOTA

無問芯穹的技術框架被概括為“M*N”,指的是對 “M 種模型” 和 “N 種晶片” 間的高效、統一部署。

清華電子系明星公司亮相:釋出國產AI算力平臺,公測免費送百億Token


此次釋出的無穹Infini-AI大模型開發與服務平臺的底層包括的多晶片算力底座,支援AMD、壁仞、寒武紀、燧原、天數智芯、沐曦、摩爾執行緒、NVIDIA等10餘種計算卡,模型層則支援了Baichuan2、ChatGLM2、ChatGLM3、ChatGLM3閉源模型、Llama2、Qwen、Qwen1.5系列等共20多個模型,整體上支援多模型與多晶片之間的軟硬體聯合最佳化和統一部署。

清華電子系明星公司亮相:釋出國產AI算力平臺,公測免費送百億Token


釋出會上,無問芯穹展示了其在10種晶片上的效能最佳化資料,在每張卡上都顯示已取得了目前行業內最優的效能最佳化效果。
清華電子系明星公司亮相:釋出國產AI算力平臺,公測免費送百億Token
在之前的文章裡,機器之心披露過,無問芯穹基於FlashDecoding++這項工作所研發出的Infini-ACC 大模型計算最佳化引擎透過對模型、系統以及硬體層面的系統最佳化,能夠推動實現大模型推理速度提升 10 倍,模型儲存空間降低 10 倍,部署時間降至小時級。

2023年,無問芯穹曾宣佈了在英偉達GPU和AMD等晶片上取得的最佳化效果,取得了當時最好的計算加速效果,實現了大模型任務2-4倍的推理速度提升。隨後,AMD中國宣佈與無問芯穹達成戰略合作關係,雙方將攜手聯合提高商用AI應用效能。

去年十二月的專訪中,夏立雪曾強調,經過無問芯穹產品最佳化後的算力成本,相比 OpenAI 可壓縮 2~3 個數量級,未來則將會達到 4 個數量級。這意味著,假如一個應用方原本需要向OpenAI支付100元的token費用,經過最佳化,這個價格最終將會被壓縮到約1分錢級別。

這次釋出會上,無問芯穹還首次對外披露了產品客戶案例。一個月前,同道獵聘在部分城市所釋出的AI驅動的數字人等由AI驅動的創新應用,是由無問芯穹提供的彈性算力使用方案,並在無問芯穹的平臺上基於開源大模型做了微調。無問芯穹方面稱,相比市面上的其他方案,實現了更高的推理加速,也大幅降低了新功能上線和執行的成本。

夏立雪表示,這一效果讓無穹團隊很有信心,所以除了開放全量註冊,也正式啟動了大算力需求方的測試邀請,提供更具價效比的算力、且在演算法和硬體上更有縱深的算力最佳化服務。

“我們對模型品牌和晶片品牌的覆蓋率還會持續提升,隨著時間的推移,無穹Infini-AI的價效比優勢會越來越突出。”夏立雪稱,未來無穹Infini-AI還將支援更多模型與算力生態夥伴的產品上架,讓更多大模型開發者能夠‘花小錢、用大池’,持續降低AI應用的落地成本。

在釋出會上,夏立雪著重提到了晶片生態的問題。一直以來,部分國產晶片的算力難以被廣泛利用的重要原因就是生態門檻過高。他強調,在使用無問芯穹的算力服務時,使用者不需要也不會感覺到底層算力的品牌差異。

另外,無問芯穹的首席科學家戴國浩還預告了2025年無問芯穹的產品計劃,“未來,凡是有算力的地方,都會有AGI級別的智慧湧現。而每一個端上的智慧來源,就是大模型專用處理器LPU,大模型處理器LPU可以提升大模型在各種端側硬體上的能效與速度。無穹LPU將於2025年面世。”

清華電子系明星公司亮相:釋出國產AI算力平臺,公測免費送百億Token

戴國浩在釋出會上向觀眾展示了“一張卡跑大模型”,作為LPU的基礎,其團隊於今年1月初推出的全球首個部署於FPGA的大模型推理IP,透過大模型高效壓縮的軟硬體協同最佳化技術,使得LLaMA2-7B模型的FPGA部署成本從4塊卡減少至1塊卡,並且價效比與能效比均高於同等工藝GPU。未來,無問芯穹的端側大模型專用處理器LPU,可以被模組化地整合到各類端側晶片中。

相關文章