從AIGC到AGI，為什麼我們需要更多的“技術信仰派”？

新闻助手發表於2024-04-15

原文網址 : https://www.jiqizhixin.com/articles/2024-04-15-13

AIGC

整理 | 伊風

採訪 | 張曉楠

嘉賓 | 巴川、朱雷、肖然

作為AIGC應用落地元年，2024開年就拋給我們一些不太好回答的問題：

在以探索AGI為長期目標時，我們該堅守技術信仰嗎？
除了複製國外GPT-4、Sora這樣的成功案例，我們該如何尋求更大發展和突破？
即便算力問題得以解決，演算法的難題如何跨越？
國內企業為什麼大都部署多個大模型？為什麼並非所有企業都該擁抱AIGC？

前不久51CTO全新直播欄目《AIGC實戰派》有幸邀請到競技世界首席資料科學家巴川，元語智慧聯合創始人兼COO、SuperCLUE社群發起人朱雷以及Thoughtworks中國區總經理、中關村智聯創新聯盟秘書長肖然，在對談中回答以上疑問。

一、“技術信仰派”還是“市場信仰派”，只是一時之爭

51CTO: 在大模型“技術信仰派”與“市場信仰派”之爭中，你們站哪一派？這背後又折射了怎樣的一種現實？

巴川：我思考過這個問題，但是沒能給出一個非黑即白的答案。就長期而言我傾向於技術信仰派，因為技術進步是推動生產力發展的關鍵因素，雖然現在AIGC被炒得非常熱，但其長期影響力仍然是被低估的。

但在短期內，大模型技術所能產生的影響又被高估了，這種誤判算是技術落地和廣泛應用的一個必經階段。短期內，AIGC將不斷向各行各業泛化，從這點來看，市場信仰派的觀點也很有價值。

朱雷：我是堅定的技術信仰派，就目前看，我認為技術派的勝算更大，因為推動大規模資料訓練和引數量的躍升已經是全球性的技術共識，大家都在“卷”技術、搶人才。

對於市場派的觀點，我認為技術需要服務於使用者和客戶，解決具體的業務問題，這個站位和邏輯也沒有問題。然而，在以探索AGI為長期目標時，國內需要一些堅持技術信仰的團隊，他們以長期研究和技術突破為目標，將商業化應用作為支援研發和基礎架構試錯的一種手段。

國內有幾家大模型公司我是很看好的，因為他們在技術層面有獨到的見解，比如做RAG搜尋增強、長文字等等。但他們也沒有隻做技術，也在各自的技術路線上嘗試了多種應用，如角色扮演、遊戲、效率工具等。我覺得正因為他們有技術信仰，所以會在自己的應用上思考的更長遠一點。

相反，如果僅從商業化的角度出發，忽視技術的成熟度，這種做法從長期看是特別危險的。我們可以看到，隨著AI技術的不斷進步，一些早期的AI應用已經失去了競爭力。OpenAI的Sora一旦對外開放，就將“殺死”很多小的AI影片剪輯、自動化生成工具。因此，在AGI的早期階段，一定要保持技術前瞻性，去做長期的投入和研究。

肖然：在AI技術浪潮中，真正盈利的往往是提供工具的一方，而非單純追求市場應用的一方。這些工具，如RAG、Raptor等，本質上是技術產品，它們的市場價值在於支援和促進技術創新。

所以，技術的快速發展已經使得所謂的市場化變得不那麼重要，因為需求實現的過程已經被極大程度地壓縮了。年輕一代，即使沒有深厚的計算機背景，也能在短時間內學會構建智慧應用。這表明，我們正在進入一個新時代，其中技術和市場之間的界限變得模糊。

從當前的角度來看，技術的重要性更為突出。如果你想創造出能夠完成更多工的智慧化產品，這非常依賴於底層基礎模型的發展。只有基礎模型得到提升，我們才能完成更多、更復雜的任務。

二、如果都是“市場派”邏輯，追上國外會變得更難

51CTO : 對比國外，國內大模型會面臨哪些不同？你們對國內大模型市場抱有哪些期待？

巴川：從算力角度來看，我們雖然在迎頭追趕，但仍然存在差距。晶片核心技術在國外手裡，這直接影響了我們獲取最先進硬體的能力；另外，顯示卡的採購困難和禁售帶來的價格飛漲也對我們產生了直接影響。

在演算法方面，雖然很多人認為國內外的演算法水平沒有太大差異，但我們使用的基礎框架，如Transformer等，大多還是來自國外。儘管國內的一些公司也在嘗試開發自己的框架，但離落地應用、甚至成為主流框架還差很多。

在資料方面，我認為國內是有獨特優勢的。網際網路快速發展的一二十年裡，我們積累了大量資料，特別是在垂直領域，一旦某個應用推廣開來，就能夠迅速覆蓋數億使用者，這是歐美尤其是歐洲難以做到的。這樣的使用者基數使得我們能夠快速積累使用者資料，並在特定垂直領域快速實現應用的落地和迭代。

朱雷：在我看來，國內外在大模型市場上的主要差異體現在發展節奏和目標上。比如OpenAI和谷歌下面的DeepMind，他們的目標更多地集中在實現AGI上。雖然他們也在推進商業化，但視野更為長遠，並在安全和基礎架構上進行了深入研究和探索。

相比之下，目前國內更多地在複製國外的成功案例，如GPT-4和Sora等。不過儘管如此，國內公司融資充足，人才儲備也具備一定水平，且具有全球化視野，這有助於我們在資料規模和質量上進行補充。

我認為，國內的期待在於未來五年內能否在基礎架構上取得突破，而不是僅僅跟隨國外的技術發展。目前，國內正在努力追趕GPT-4的水平，同時也有探索非Transformer架構的嘗試。因為Transformer架構本身存在侷限性，預測下一個token，並不是真實世界的邏輯，因此這個架構並不能做出世界模型。

肖然：即便算力問題得到緩解，我們仍然面臨著代際演算法差異的挑戰。目前，國內的大模型技術多在複製和追趕國外的成就，並嘗試做成功產品的理解和復現。但真的去做一些研究，比如Transform架構的根本突破在哪裡，國內相關的討論又太少，我們需要更多的聲音和研究來探討和實現下一代的演算法革新。

在應用層面，國內的大模型應用多集中在企業內部，而國外的模型精度更高，To C產品更為豐富。這背後的核心原因在於底層模型的成熟度差異。國內企業被迫去做模型微調和基礎算力設施，透過這些應用手段，提升模型在特定領域的精度。

我樂觀估計，國內的算力問題正在得到國家層面的有效解決。但同時，我擔心的是，當我們解決了算力和模型精度問題後，國際上可能出現新的演算法突破，而科技巨頭會效仿OpenAI選擇閉源，屆時我們就會被拉大演算法的代際差距。

三、AI太重要了，企業多模型部署“留後路”

51CTO: 具體到國內企業部署和採用大模型，你們發現有哪些值得關注的特點，或者一些有趣的現象？這背後的深層原因是什麼？

朱雷：我觀察到國內企業往往會同時部署多個大模型。在與各行各業的企業接觸中，包括央企和上市公司，我發現他們會同時採購兩三家公司提供的大模型，並結合一些開源模型進行微調。這些企業會利用向量資料庫和增強工具，使得基於大模型構建的應用背後有多個模型支撐。

這種現象背後的原因可能有幾個方面。首先，AI大模型目前被認為非常重要，因此企業願意投入較多預算。隨著開源能力的提升，大模型的部署成本已經降低，儘管後續的資料清洗和模型推理可能成本較高，但採購模型本身已經變得相對便宜。

其次，當前大模型的能力還比較有限，特別是在特定行業的應用上。這就導致企業在應用大模型時會部署多個模型，以期望不同模型在不同方面的能力可以互補。

最後，AI的重要性不言而喻，但企業對於國內大模型的發展前景還不太確定，因此他們傾向於嘗試多個模型，以觀望哪個模型能夠更好地發展，以免選錯後對企業造成較大損失。

肖然：從成本來看，儘管模型本身的成本已經降低，但與之配套的運維成本卻相對較高。企業在微調大模型時需要投入額外的資源來管理知識庫和最佳化整個資料處理流程，這導致了需要額外僱傭專業人員來維護和最佳化這些模型。而部署的多模型，每個基礎模型相對小一些，微調後能達到專事專用的效果。

此外，大型組織更有可能部署自有模型，而小型組織則不太可能考慮這一選項。在大型企業中，各個部門可能會根據自己的需求獨立部署和使用不同的模型。這種分散的部署方式雖然短期內看似效率不高，但實際上有助於保護組織結構擁有一定的自由空間，允許各部門根據自己的業務需求靈活調整。

最後，企業特別希望大模型的能力能夠與現有的工具鏈相結合，而不是完全替換現有的工作流程。例如，企業可能更願意在現有的辦公平臺上整合模型來輔助工作，比如釘釘AI這樣的設計，而不是遷移到一個全新的系統中去。

51CTO：企業的模型部署、AIGC應用等等由哪個部門負責？

肖然：數字化能力強的公司可能會成立專門的人工智慧中心，來負責模型和算力的相關工作，而應用則由具體實踐這些工具的相關部門負責。

在為企業部署AI能力時，負責牽頭的角色往往是CIO或CTO。然而，隨著人工智慧戰略的重要性日益增加，一些企業包括我們自己公司開始設立CAO（Chief AI Officer）來專門負責人工智慧戰略的制定和執行。從長遠來看，或許越來越多的企業會設定類似CAO的崗位。

巴川：我們公司算是一個典型的中型網際網路遊戲公司，我們有一個技術中臺，其中包括大資料、機器學習和深度學習等方向。技術中臺自然成為了大模型應用的主要推動者。同時，我們的業務部門，比如說美術部門、銷售部門，也在自下而上的擁抱技術變革。

我們也在嘗試多個模型，因為目前還不清楚哪個模型更合適。在這個過程中，我們會直接呼叫介面，也會對大模型進行微調。這其中涉及到成本和產出比的問題，業務部門會根據業務場景直接評估價效比，決定是否值得投入。

然而，技術部門在推動大模型應用時，可能會發現價效比並不高，這時我們的步伐就會受到限制。一些大模型，比如馬斯克最近釋出的Grok開源大模型，雖然下載不難，但能執行起來的機器需要200萬成本，這就需要我們仔細考慮場景的適用性和成本效益，雖然我們自己也很好奇效果，但如何能說服管理者批預算是個難題。

對於中小公司來說，通用大模型的成本可能是難以承受的，可能需要大廠或國家意志整合資源才能實現。此外，我們也在思考，專注於特定業務場景的大模型是否會讓我們離AGI越來越遠。

四、“新質生產力”AI+，已經敲開了技術變革的門

51CTO：隨著大模型採購成本下降以及垂類模型的成熟，所有企業都應該擁抱大模型嗎？AIGC能在未來成為所有企業的剛需嗎？

巴川：隨著成本不斷下降，我認為中小企業完全有可能開始使用大模型。在形式上，他們可能會更多地選擇直接呼叫現有的大模型介面，利用其能力來降本增效，並在特定的市場業務場景中創造價值。而大型企業，如百度、阿里，可能會開發自己的模型，以保持技術壁壘和市場競爭力。

從國家層面來看，整合資源開發具有自主智慧財產權的大模型也是非常重要的，這不僅是技術追求，也是社會責任的體現。必須有人去開發大模型這樣的基礎設施。

肖然：AIGC就屬於國家提出的“新質生產力”這個概念，隨著技術的進步，未來的情況將與現在大不相同，儘管可能不會有像iPhone那樣的顛覆性時刻，但人工智慧的應用仍會讓人眼前一亮。

從這個角度來看，並不是所有企業都需要自己部署模型。隨著問題逐漸被解決，特別是走向AGI時，企業可能不再需要自己擁有模型。正如黃仁勳所說，“打敗你的不是AI，而是使用AI的人”。

朱雷：雖然大模型和AI技術的成本正在下降，但目前大多數企業的核心業務流程還不能依賴於大模型。目前，大模型的應用主要集中在相對邊緣的業務上，成本的降低並不直接等同於可以落地實施。真正要影響企業核心業務的落地，除了成本，還需要模型在準確性和推理速度上達到可用的水平，而目前這個階段還有相當大的差距。

五、“賣鏟子”是門好生意，引領應用新趨勢是“天花板”

51CTO：如何判斷一款AIGC應用是否優秀呢？有什麼標準嗎？

巴川：我會首先考慮合規性，這對於公司的業務至關重要；其次，AIGC生成的內容是否有C端使用者願意買單，這是一個直接且重要的評判標準；此外，我希望能夠看到應用中有些特色，能夠把相關的資料積累用起來，形成一定的壁壘。

肖然：我認為這個時代值得做的生意就是“賣鏟子”。使用AIGC技術提供工程化支援的工具和服務——是一個有前景的事情。直接做大模型的門檻太高了，不適合一般的玩家入場。無論AIGC應用是面向C端還是B端，都需要將這些技術工程化、規模化，讓組織能在內部享受到AI技術帶來的便利。

如果涉及到直接面向消費者的應用，我會在合規的基礎上增加對高頻場景替代的考量。我喜歡那些能夠改變使用者習慣、增加使用者粘性的應用。

朱雷：從長遠來看，我認為AIGC應用在互動方面還有很大的創新空間。儘管目前市面上已有一些成熟的互動模式，如智慧音響和流程機器人，但未來可能會有新的互動模式出現，特別是適合AGI的新型互動模式，我期待在國內看到這樣的創新。

——活動推薦——

“AIGC創新中國行”評選由51CTO發起，聯合業內生成式AI領域頂級專家、投資人權威釋出，並經企業一線實踐者、廣大開發者公開投票，旨在發掘和表彰在生成式AI領域傑出實踐企業、產品方案和個人，推動生成式AI技術的創新探索和AIGC更廣泛的落地實踐。

評選分為⾃主報名、公開評選、結果公佈三個階段，透過⽤戶投票、專家評審團打分形式，產⽣2024年度AIGC創新先鋒者案例、2024年度AIGC創新實踐案例、2024年度⽣成式AI創新產品⽅案、2024年度⽣成式AI影響⼒⼈物等獎項。

從爬⾏到奔跑 - 我們為什麼需要單元測試？
2023-09-22
為什麼我們需要 Vuex
2019-02-28
Vue
我們為什麼需要CDP？
2022-06-14
我們為什麼要技術寫作
2019-06-17
為什麼我們從Yarn切換到pnpm
2020-07-08
YarnNPM
我們為什麼需要async/await ?
2019-03-25
AI
到底為什麼我們需要 Clickhouse?
2022-10-27
我們為什麼需要雲原生？
2021-03-19
為什麼我們從RabbitMQ切換到apache kafka？
2018-08-24
MQApacheKafka
為什麼我們從Webpack切換到Vite - Replit
2021-04-29
WebVite
為什麼大語言模型能將我們帶入AGI？
2024-06-13
模型
我們為什麼需要 lock 檔案
2019-01-16
[譯] 為什麼我們需要 Web 3.0
2018-10-07
Web
什麼是Web workers？為什麼我們需要他
2020-10-19
Web
進擊的WebRTC：我們為什麼需要它？
2018-07-04
Web
從服務之間的呼叫來看我們為什麼需要Dapr
2022-02-05
我們為什麼需要API管理系統？
2019-01-26
API
為什麼我們需要訊息佇列？
2024-01-25
佇列
為什麼我們需要volatile關鍵字？
2019-05-25
golang拾遺：為什麼我們需要泛型
2020-10-17
Golang泛型
為什麼我們需要配置環境變數
2020-08-26
變數
為什麼我們需要資料庫事務
2021-08-05
資料庫
為什麼我們需要更注重原始碼安全？
2022-03-22
原始碼
我為什麼要學技術
2024-05-25
我們需要什麼樣的 ORM 框架
2024-03-22
ORM框架
為什麼我們需要服務網格Service mesh？
2018-06-29
我們為什麼需要 DevSecOps 和製品倉庫？
2019-04-28
dev
為什麼從事雲原生開發需要學習容器技術
2022-04-15
阿里巴巴資深技術專家無相：我們能從 InteliJ IDEA 中學到什麼？
2019-04-08
阿里IntelIdea
對話天雲資料雷濤：從IT到DT，我們需要什麼樣的資料庫？
2022-12-29
資料庫
為什麼我從 npm 到 yarn 再到 npm?
2018-05-03
NPMYarn
當我們在聊 RN 時，我們在聊什麼 | 技術點評
2021-03-06
講道理，React中，我們為什麼需要寫 super(props)？
2019-03-04
React
為什麼我們需要Logstash,Fluentd等日誌攝取器？
2020-08-23
我們為什麼需要模擬服務機器人？
2020-08-25
機器人
現如今的技術浪潮中，我們到底該做些什麼？
2019-08-02
[譯] 我們能從 Redux 原始碼中學到什麼？
2018-03-22
Redux原始碼
[譯] 從 Cron 到 Airflow 的遷移中我們學到了什麼
2019-03-01
AI