OpenAI停服,國產大模型免費用!開發者Token自由實現了

机器之心發表於2024-06-25
今天凌晨,OpenAI 突然宣佈終止對中國提供 API 服務,進一步收緊國內開發者訪問 GPT 等高水平大模型。國內開發者真是太難了。

圖片

好在,隨著開源大模型水平越來越高,開發者已經有很多不錯的 “平替”,比如 Qwen2、DeepSeek V2 等模型。為了給開發者提供更快、更便宜、更全面、體驗更絲滑的開源大模型 API,AI Infra 領域的專業選手矽基流動(SiliconFlow)上場,推出了一站式大模型 API 平臺 SiliconCloud。

剛剛,矽基流動為國內開發者獻上一份前所未有的大禮:Qwen2 (7B)、GLM4 (9B)、Yi1.5(9B)等頂尖開源大模型永久免費

從此,開發者 “Token 自由” 不再是夢,可以甩開膀子開發超級應用了。

“Token 自由” 傳送門,一鍵直達:

cloud.siliconflow.cn/s/free

圖片

正如在工業化時代,機械化工廠推動了大規模生產商品的效率。在大模型時代,生成式 AI 應用的繁榮亟需高價效比的 Token 生產工廠。

透過雲服務接入大模型 API 已成為開發者的最優選擇。不過,很多平臺只提供自家大模型 API,不包含其他頂尖大模型,同時,在模型響應速度、使用者體驗以及成本方面,遠不能滿足開發者的需求。

現在,矽基流動的超級 Token 工廠 SiliconCloud,讓開發者不用再花費精力部署大模型,大規模降低 AI-Native 應用開發門檻與成本。

大模型 Token 工廠

即時上新、極速輸出、價格親民

既然叫 Token 工廠,那使用者喜歡的模型就都能直接在 SiliconCloud 上找到。

最近,大模型社群相當熱鬧,開源模型不斷重新整理著 SOTA,輪流霸榜。

矽基流動第一時間將這些大模型快速上架到 SiliconCloud,包括最強開原始碼生成模型 DeepSeek-Coder-V2,超越 Llama3 的大語言模型 Qwen2、GLM-4-9B-Chat、DeepSeek V2 系列模型。還支援 Stable Diffusion 3 Medium、InstantID 等文生圖模型。

值得一提的是,對 DeepSeek V2 等部署難度極高的模型,SiliconCloud 是除官方之外唯一支援這些開源大模型的雲服務平臺。

考慮到在不同應用場景下需要選擇適合的大模型,開發者可在 SiliconCloud 自由切換。

圖片

這樣的開源大模型聚合平臺,已經為開發者提供了不少便利,但還遠遠不夠,作為世界頂級的 AI Infra 團隊,矽基流動致力於將大模型部署成本降低 10000 倍。

要實現這一目標,核心挑戰是如何大幅提升大模型推理速度。對此,SiliconCloud 做到了什麼程度?

直觀上圖,感受一下 Qwen2-72B-Instruct 在 SiliconCloud 上的響應速度。

圖片

剛開源不久的 SD3 Medium 的生圖時間在 1s 左右。

圖片

這些開源大模型的響應速度變快,相同的算力的產出更高,價格自然就打下來了。

SiliconCloud 上的大模型 API 價格也(很卷)更為親民。即使是 Qwen2-72B,官網顯示只要 4.13 元 / 1M Token。新使用者還可免費暢享 2000 萬 Token。

開發者評價:“速度快得再也回不去了”

SiliconCloud 一經發布,不少開發者就在各大社交平臺分享了使用體驗。部分 “自來水” 使用者是這樣評價的:

知乎上,機器學習系統專家 @方佳瑞稱讚了 SiliconCloud 的輸出速度,“用久了就受不了其他大模型廠商 web 端的響應速度”。

圖片

微博使用者 @祝威廉二世稱,其他幾家平臺都不敢放 Qwen2 大規模引數的模型,SiliconCloud 都放了,速度很快,還很便宜,一定會付費。

他還提到,大模型的最終產物是 Token,未來會由矽基流動這樣的 Token 工廠,或 OpenAI、阿里雲這樣的大模型企業或雲廠商完成 Token 的生產。

圖片

還有 X 使用者強烈推薦 SiliconCloud,體驗太過絲滑,尤其還有體貼周到的一流售後服務團隊。

圖片

微信公眾號博主評價:SiliconCloud 是國內同類產品中體驗最好的一家。

圖片

這些評價有一個明顯的共性,他們不約而同地提到了 SiliconCloud 平臺的速度。為什麼它的響應這麼快?

答案很簡單:矽基流動團隊做了大量效能最佳化工作。

早在 2016 年,矽基流動的前身 OneFlow 團隊就投身大模型基礎設施,是世界上做通用深度學習框架的唯一創業團隊。再次創業,他們基於豐富的 AI 基礎設施及加速最佳化經驗,率先研發了高效能大模型推理引擎,在某些場景中,讓大模型吞吐實現最高 10 倍加速,該引擎也整合到了 SiliconCloud 平臺。

換句話說,讓開發者用上輸出速度更快、價格實在的大模型服務,是矽基流動團隊的拿手絕活。

Token 自由後,現象級應用還遠嗎?

此前,阻礙國內開發者開發 AI 應用的一大因素是不方便訪問高水平大模型,即便做出了優質應用也不敢大規模推廣,因為燒錢太快,他們無力承受。

隨著國產開源大模型不斷迭代,以 Qwen2、DeepSeek V2 為代表的模型已足夠支援超級應用,更重要的是,Token 工廠 SiliconCloud 的出現能解決超級個體的後顧之憂,他們不用再擔心應用研發與大規模推廣帶來的算力成本,只需專注實現產品想法,做出使用者需要的生成式 AI 應用。

可以說,現在是超級個體開發者與產品經理的最佳 “掘金” 時刻,而 SiliconCloud 這個好用的掘金工具已經為你準備好了。

再提醒一下:Qwen2 (7B)、GLM4 (9B) 等頂尖開源大模型永久免費。

歡迎走進 Token 工廠 SiliconCloud:

cloud.siliconflow.cn/s/free

相關文章