新火種AI | I發展何去何從?李開復:中美大模型只能存活五六家
作者:小巖
編輯:小迪
如果把時間回撥5年,我們會發現,全世界範圍內能夠進行AI大模型研發的團體,屈指可數。
要知道,能夠訓練大模型的算力裝置基本是近3年釋出的,而現象級產品ChatGPT的誕生,不過是最近一年的事情。
畢竟,大模型的發展需要極高的門檻,不僅需要強大的算力資源,更需要豐富的資料資源給予支援。大模型時代,離不開大算力,也離不開大資料。
但也就在一年的時間,各式各樣,供大模型的公司和機構如雨後春筍般冒出頭。大家開始角力,繼而陷入白熱化的競爭狀態 。就連AI科學家李開復都表示,未來中美的大模型公司中,能存活下去的只有5、6家。
我們不禁感嘆,大模型賽道從“高處不勝寒”到擠兌嚴重,竟然只需要如此短的時間。
“除了大廠,中美加起來應該可以支撐5、 6家左右”。
12月14日,在一場與AI相關的對話中,零一萬物的CEO李開復被問到了一個問題:大模型賽道最終能有幾家活下來?對此,李開復也算是知無不言,他認為,除了大廠,中美加起來應該可以支撐五六家左右。
李開復表示,如今來看,做巨大預訓練模型的機會正在變少。這個通道不能說是完全關閉了,但勢必會越來越難。未來只有在需要新技術的時候,才會出現更多的機會。與此同時,李開復還給出了AI未來的發展方向: AI Infra(人工智慧基礎框架技術)和AI應用等方面。
李開復解釋,“做AI應用的機會就是現在,正如10多年前移動網際網路所面臨的時代一樣。較早抓到機會的微信就成功了。當然,後續也有抖音,拼多多等陸續崛起。但一定是越早入局,機會越大。真正有夢想有野心的開發者,應該是要做AI-First(AI優先) ,AI-Native(AI原生)的應用,這些應用才可能成為AI 2.0時代最偉大或是最賺錢的應用”。
事實的確如此。專業性大模型AI的開發競爭激烈,各大公司在訓練自家大模型時,還不得不面臨巨大的挑戰和限制。 一方面,大模型的訓練需要龐大的計算資源和時間,如果不是大廠或者擁有雄厚的資本支援獨角獸,這勢必會成為一個難以逾越的壁壘。另一方面,大模型的訓練資料需要大量的人工標註和清洗,這個過程專業性極高,複雜而耗時。更重要的是,大模型的應用面臨著資料隱私和安全方面的挑戰,“如何保護使用者資料和防止濫用”是每個大模型開發者都需要考慮清楚,亟待解決的問題。稍有不慎,就會陷入泥潭。
李開復領銜零一萬物,釋出開源中英雙語大模型“Yi”。
雖然強調AI大模型即將發展成“紅海賽道”,但李開復本人卻是賽道里卷的最兇的那個。
作為創新工場的董事長兼CEO,他成立了自己的AI公司“零一萬物”。就在上個月,零一萬物釋出了開源中英雙語大模型“Yi”。
此次開源釋出的Yi系列模型,包含34B和6B兩個版本,11月2日,零一萬物在Hugging Face上傳了這兩個引數。據悉,Hugging Face是全球受歡迎的大模型,資料集開源社群,被認為是大模型領域的GitHub,在大模型英文能力測試中具有相當權威性。
根據Hugging Face英文開源社群平臺和C-Eval中文評測所提供的最新榜單,Yi-34B分別在預訓練大語言模型和中文大模型榜單C-Eval排行榜爬升到第1位。這也是迄今為止成功登頂 Hugging Face全球開源模型排行榜的國產模型。
與此同時,零一萬物新一輪的融資十分順利,由阿里雲領投 。目前,零一萬物估值已超10億美元,躋身獨角獸行列。李開復在2023年3月建立了零一萬物團隊,6月開始運營。 也就是說,在短短8個月的時間裡,零一萬物不僅推出了核心產品,更躋身成為估值超10億美元的“獨角獸”。
行業內盡是大廠和“獨角獸”,也難怪李開復要感嘆大模型賽道競爭激烈了。
大模型Yi全球領跑,旨在打造打造更多的To C Super App。
據瞭解,Yi-6B和Yi-3B分別代表資料引數量為60億和340億,按照李開復的說法,“34B是一個黃金尺寸”。
34B的最大優勢在於一方面它不會小到沒有湧現或者湧現不夠,甚至已經完全達到了湧現的門檻;另一方面,它又沒有太大,允許高效率的單卡推理。Yi-34B模型在多項評測基準中全球領跑,基於超強Infra下模型訓練成本實測下降40%,模擬千億規模訓練成本則可以下降多達50%。
所謂AI Infra,全稱為AI Infrastructure ,即人工智慧基礎架構技術,主要涵蓋大模型訓練和部署提供各種底層技術設施,包括處理器,作業系統,儲存系統,網路基礎設施,雲端計算平臺等,是模型訓練背後極其關鍵的“保障技術”。
AI Infra是大模型行業發展至今較少被關注到的硬技術領域,但也是十分關鍵的領域。用李開復的話說,“做過大模型Infra的人比做演算法的人才更稀缺”。
對於零一萬物而言,因為有了Yi做基礎,更多To C端的超級應用才有可能出現。Yi的定位是通用底座,已在 Hugging Face,ModelScope,GitHub 3大全球開源社群平臺正式上線。與此同時,Yi系列量化版本,對話模型,數學模型,程式碼模型,多模態模型等都將很快亮相。
按照李開復的邏輯,AI的技術壁壘終將會被一個個的攻破,對於AI公司來說,可持續,可增長的盈利才是要緊事,無法商業化的公司終將被淘汰。 在AI 2.0時代,最大的商機一定是來自超級應用,而且是消費者級別的,諸如抖音,微信一樣的超級應用。
目前,零一萬物已經啟動100B以上引數規模的模型訓練,而多模態大模型團隊也已經集結了10多個人,說明零一萬物將朝著“消費級應用”的方向努力。而這些,恰恰與李開復所說的“AI Infra和AI應用才是未來”的理念,不謀而合。
來自 “ ITPUB部落格 ” ,連結:https://blog.itpub.net/70035178/viewspace-3000840/,如需轉載,請註明出處,否則將追究法律責任。
相關文章
- AI熱火朝天,2020的安卓程式設計師該何去何從?AI安卓程式設計師
- 財報之後,新氧的內容種草何去何從?
- Sora 時代的 AI 影片生成何去何從?SoraAI
- Google I/O 2018 之後,Android 工程師將何去何從?GoAndroid工程師
- 當程式碼遇上詐騙,開發者該何去何從?
- 演算法、硬體、框架,2019年AI何去何從?演算法框架AI
- 新「船長」的領航下,索尼將何去何從
- 【人工智慧】面對人工智慧的發展,人類該何去何從?人工智慧
- 電子配線架何去何從?
- 4 年多經驗,何去何從
- 未來,人類將何去何從?
- 團隊解散,我們該何去何從?
- Kubernetes風頭正盛,Docker何去何從?Docker
- 小公司測試該何去何從
- 現在老人養老該何去何從?
- 全球經濟蒸發,網際網路人該何去何從?
- 40歲大齡失業程式猿,未來該何去何從
- LeSS 的誕生(一):大規模團隊該何去何從
- 數字化轉型新階段,ICT企業該何去何從?
- 當生成式AI照進醫療,醫患關係將何去何從?AI
- 數局:從火爆到冷清,小龍蝦何去何從?
- 新火種AI|零到估值超十億,李開復如何8個月打造AI 2.0獨角獸?AI
- 5G多址技術何去何從?
- 華瑞IT教育:高考落榜,該何去何從
- CDGA|資料監管越來越嚴,資料治理髮展何去何從?
- 新冠肺炎疫情後中外合資企業:何去何從?(附下載)
- AI的發展浪潮應推向何處?AI
- 馬化騰深夜發問 網際網路未來何去何從
- 深度學習的困境,我們該何去何從?深度學習
- 2020年後中國入境遊將何去何從?
- 雲原生時代,資料庫該何去何從?資料庫
- 資料中臺與資料治理將何去何從?
- 我是一個請求,我該何去何從
- 從螺絲釘到無名小卒-IC工程師何去何從工程師
- 北上港深, 海歸程式設計師何去何從?程式設計師
- 系列好文 | Kubernetes 棄用 Docker,我們該何去何從?Docker
- Python是如何火起來的 為何發展如此迅速Python
- 學雲端計算與大資料前景如何?就業又該何去何從?大資料就業