華為雲大咖說:開發者應用AI大模型的“道、法、術”

华为云开发者联盟發表於2024-05-30

本文分享自華為雲社群《華為大咖說 | 企業應用AI大模型的“道、法、術” ——道:認知篇》,作者:華為雲PaaS服務小智。

本期核心觀點

  1. 上車:AGI是未來5~10年內,每個人都無法迴避的技術革命,建議就近上車。
  2. 迭代:眼下的AI大模型應用都還只是過程稿,仍在快速迭代,切忌刻舟求劍。
  3. 預判:AI大模型的演進哪些是“不變項”?不要在AI大模型前進的車輪下“繡花”。
  4. 思考:AI大模型的底層邏輯是什麼?緊跟第一性原理。
  5. 成長:AI應用的機會窗才剛剛開始,當下是最佳的成長週期,無論是組織還是個人。

PS.我雖然儘可能把得到多方佐證的資訊和觀點拿出來分享,但也不能保證完全準確,歡迎留言討論,兼聽則明。

01 上車:AGI是未來5~10年內,每個人都無法迴避的技術革命,建議就近上車

在大變局面前,常見幾種態度是 “看不見、看不懂、看不起、來不及”。

“看不見”目前可能性不大,“來不及”也還言之過早,可能更多是中間兩者,夾雜著一些焦慮或是牴觸,其實這很正常,誰不是呢。

關於AGI定義很多,問題就因為這個詞兒太通用,不夠具體,我覺得就以“AI智商超過人,能幹好聰明人能幹的事兒”為佳。

我最近觀看了好多國內外大佬的採訪,基本上對於AI的智商超過人這事兒是沒有分歧的,只是如何實現、多久實現有些爭議,至少可以說明一點,這個事兒靠譜,沒必要再懷疑其真實性。至於是3~5年,還是5~10年,我覺得已經不再重要。哪怕短期高估一點也無所謂,長期不能低估就對了。

以後會發生啥,沒有人能說清楚。只是基於每個人的風險偏好不同,給出不同的處置方式。但是,這就是現實,滾滾而來,認清和接納現實也是一種態度。

講個真實的段子:前陣子,Hinton老爺子(加拿大計算機學家和心理學家)在演講上,建議安排人在關鍵時刻負責“資料中心斷電”,認為低階智慧掌握高階智慧在自然界從未有過。(大劉誠不欺我,這不就是《三體》裡的“執劍人”?)

不管怎麼樣,最近5年,對我們最重要的,就是積極擁抱AI大模型,理解AI大模型,並在生命中應用AI大模型。

從去年開始,我對自己的職業發展做了重新定位,就是專攻AI大模型2B應用,我認為這是我未來十年唯一值得做的事兒。從讀書開始,前前後後小20年的技術積累,在這一刻有了新的意義。

我甚至給我家五歲的孩子搞了個數字人,設定成五年後的她,希望能夠在日常生活中給她一些幫助和指導。

所以,這裡我建議“就近上車”,也就是說,不管你的生活、工作是什麼樣的,都應該積極設想,我該怎麼在我的日常生活中加入AI大模型?能用哪些AI工具來輔助和加持?未來還有哪些場景AI可以幫助到我?

02 迭代:眼下的AI大模型應用都還只是過程稿,仍在快速迭代,切忌刻舟求劍

當下哪怕是ChatGPT,也都只是AGI的過程稿,這個很關鍵:

  • 一方面,這會影我們對未來的判斷,拿著ChatGPT或是Mid-Journey當下的水平來對標未來、構思應用場景,可能有點刻舟求劍了。
  • 另一方面,容易跟風地學,別人做了個啥,咱也要做個啥,都得是對話方塊、都得輸入、能聊天、能生成......

華為雲大咖說:開發者應用AI大模型的“道、法、術”

此外,值得關注的是,這並不意味著當前的AI過程稿“微不足道”,實際上其已經開始顛覆一些具體場景,比如Sora與短影片,Suno與音樂,MJ與插畫,微軟Copliot(New Bing)與搜尋,Devin與程式設計,ChatGPT與很多很多瑣事,等等,就在當下以肉眼可見的程度佔據一席之地。(我自己也是AI工具的高頻使用者,也確實變懶了,今天數了下,手機裝了不下十款各式AI軟體,最近常用的是ChatGPT、文心一言、微軟Copilot、Kimi Chat。)

03 預判:AI大模型的演進方向預判,不要在AI大模型前進的車輪下“繡花”

AI大模型演進非常快,說是“日新月異”一點也不誇張。但這對於我們這些用AI大模型的人來說,除了一驚一乍地看熱鬧,可能更重要的是從變化中,找到其中的不變性。

因此需要對AI大模型的演進方向,有個大致的預判,這樣可以避免我們在大模型前進的車輪下“繡花”。不然好不容易搞點小突破、小創新,繡了個花,基模型一升級,就啥也不是了。

我有幾個基本的邏輯判斷 ——“五更”:

  • 更快
  • 更準
  • 更長(上下文)
  • 更便宜
  • 更多模態

這一切從GPT、Claude、Gemini等TOP選手的演進上就看得出來。

04 思考:AI大模型的底層邏輯是什麼?第一性原理是什麼?

這裡我不敢說自己完全理解,我只能把我聽到、學到的分享出來:

1、scaling law,大力出奇跡: 我想這基本上就是搞AGI的公司唯一信奉的真理了,簡單說就是“大力出奇跡”,scale發生在幾個方面——資料、算力、引數,在算力恆定的情況下,目前最優先增加的是資料。就在這周,Databricks開源的DBRX模型,引數比Grok小3倍,資料量出奇的大,效果超過GPT3.5。(Scaling Law是指模型的效能與計算量、模型引數量和資料大小三者之間存在的關係。具體來說,當不受其他因素制約時,模型的效能與這三者呈現冪律關係。這意味著,增加計算量、模型引數量或資料大小都可能會提升模型的效能,但是提升的效果會隨著這些因素的增加而遞減。)

2、Next Token Prediction,生成式: 當然這裡不僅是生成文字和影像token,還是生成影片patch。這裡用illya(OpenAI 首席科學家)的話說,就是如果大模型能很好地預測下一個字,就意味著能對世界建模。說人話,就是如果我能猜到你打算說啥,我肯定也就很瞭解你。目前大模型因為學到了很多通用知識,所以對我們這個世界確實有一定的瞭解。(Next Token Prediction(NTP)是一種文字補全能力,或者說是文字接龍。它是自然語言處理(NLP)中的一個概念,具體指的是給定一段文字的前幾個詞(或稱為tokens),預測並生成下一個詞或tokens的過程。)

3、資料第一、算力第二:這句話我忘記具體出處,但是這句話一直在被證明。雖然AGI的路還不清晰,但是怎麼搞出GPT3.5甚至GPT4這樣的模型,我感覺頂級玩家之間已經沒有太多護城河了。不然不可能一個個地都開始揭榜了。當然算力背後,除了卡,還有能源,所以微軟的核能超算中心是極有可能的。

4、人才密度:與傳統IT產品的外包方式不同,這波AI大模型初創公司主打的就是團隊人才密度。如下是Sora的團隊畫像:小於10人、95後主導、北美計算機名校、AI Native。如果打算搞搞AI大模型、要組建團隊,用好招新的機會,非常重要,最近幾年的應屆生質量也是非常高的。反觀我們自己,這些技術老兵,就更要緊跟技術發展了,好在事物很新,有一些後發優勢。

華為雲大咖說:開發者應用AI大模型的“道、法、術”

5、未來:一個更好的架構、一個自學習的AI:現在無論GPT背後的Transformer也好,Sora背後的DiT也罷,都沒辦法很好地把整個世界的各種模態統一起來,這可能需要一個更好的架構。然後就是一個不需要人類資料,透過跟世界互動就可以學習的AI,這樣AI就不會侷限於人類訓練的資料量限制。

當然,除了這些,還有很多我沒搞明白的,也有很多工程上的問題,但是我認為底層邏輯大致如此。我自己的認知迭代方式是,把每一個新事件套在這些邏輯上,如果能套進去,說明還沒有超出認知,如果不能,那就再重新認識、迭代。

05 成長:AI應用的機會窗才剛剛開始,當下是最佳的成長週期,不求短期建功立業

我認為AI大模型帶來的應用側改變,一切才剛剛開始,甚至還不能說已經到來。理由很簡單,因為基建還沒穩定(無論是大模型,還是底層算力資源)。

所以我認為,當下是非常好的時機,來賦能使用者、組建團隊、培養人才、賦能業務、開始做知識管理和治理、開始積累AI大模型應用的經驗和教訓,持續迭代,一個場景成熟了就推廣一個能力,不能指望短期內能建功立業。

《道德經》有云:“道可道,非常道”。關於AI的本質認知,其實還遠未到清晰的程度,但是人認識世界不就是這樣嘛,人們到現在也沒有完全理解大腦是怎麼玩兒的。

這輪AI大模型之所以稱之為顛覆性創新,是因為桌子掀得太快。每個人在這輪變化中,都是迷茫和無助的,唯有重新整理認知、重新定位,方能在5~10年後留下更多選擇權。以上皆為個人觀點,與君共勉~~

點選關注,第一時間瞭解華為雲新鮮技術~

相關文章