2024 年終總結

少年發表於2024-12-25

前言

2024 年,是抽象的一年。

印象中抽象是個中性偏貶義的詞,而這樣的認知,在 2024 得到了扭轉,居然還有點中性偏褒義的趨勢。

比如:

錯飯王陶吉吉,憑藉 "哦啊啊誒" 的抽象,重啟 Soul Power II。

無人問津諾米,憑藉 "我要迪士尼" 的抽象,打造成都新地標登頂央視。

普普通通麥琳,憑藉 "麥言麥語" 的抽象,給芒果狂攬數億引各路打拳。

更敏感抽象的例子就不舉了。

原來 "要成功先發瘋" 的執念,被替代成先抽象,也合理。

畢竟,眾所周知,世界只是個巨大的草臺班子。而認清這些之後還能保持直面生活的熱情,可能這就是不被討厭的勇氣?

這大抵也是高中取筆名為少年的緣由,總覺得出走半生歸來的倔強是美好的。

只是那年 18 歲,寫下 "當你不止一次來回翻看以前的文字並唏噓不已時,你已經老了",更多是為賦新詞強說愁的感傷。

現在 28 歲,十年一瞬,到處還是暖洋洋的陽光嗎,奔騰電腦替代我來思考了嗎,輕鬆一下的還是 WINDOWS 98 嗎?

而手機上的最新彈窗在告訴你,今夕是何年,OpenAI o3 來了。

工作

秉承 "出名要趁早" 的精神,在 RAG & SFT 兩條路上繼續大刀闊斧,做了不少創新,突破,然後落地,應用。

自研 Text2SQL 微調模型投產騰訊雲公有云 DMC,也拿到了大資料分析 & BI 智慧體 Oteam 邀請券。

自研 AI 程式碼靜態掃描提供了可大規模複製落地的 AI 解決方案,投產騰訊雲 4T(TDSQL/TBDS/TCE/TCS) 專案,發現數百嚴重缺陷 Bug。

再然後,就是拿點個人獎,部門獎,BG 集團獎,簡單質樸的一年。

順手也給一些開源的牛逼專案貢獻合入了些微不足道的程式碼。

也在內部很多大型 AI 沙龍會上做了些簡單的分享。

雖然經常被 "調侃" 這 Part 講的很尬,但是還是想在這裡分享下。

寫這頁 PPT 還是在年中,那時還不是寂寞的季節,耳機裡沒有 New Boy 被未來虛晃一槍的欺騙,只有心亂飛的想象。

Ilya 也不過剛出走 OpenAI,順手點讚了一篇論文:The Platonic Representation Hypothesis

看完之後很有啟發,結合了過往的經驗,我總結出了 AI 的 "道法術器"。

寫這個的初衷還是想著,如果能在分享一開始跟大家對齊對 AI 的認知,是不是接下來的內容就沒那麼難聽懂呢?

:) 事實證明並沒有。

回到這篇論文,其實是用柏拉圖的洞穴寓言,把曾經人對自然和科學的知識探索,比喻成我們現在對 AI 的投餵。

無論是圖,還是文,或者更多的模態,對於同一個知識真理的描述,不過是這個知識真理的多個不同面的投影,抽象到更高維度,是高度統一的。

所以我總結:

  • 道 人類的認知投射於真理 -> AI 的認知投射於人類 -> AI 認知能投射於真理【 AI 柏拉圖表徵假說 】

那既然 AI 認知能投射於真理,為什麼 AI 很多時候靠不住?

對此我給出的答案是,這是一個學和思的問題。

一個是 AI 沒學過這個知識,所以需要 RAG/Agent 來補充學習,一個是 AI 學了但是沒有思考過這個知識,所以需要 SFT/RLHF 來對齊思考。

這也是我兩條路在並行的原因。

所以我總結:

  • 法 學而不思則罔,思而不學則殆 -> 學而不思則欠擬合,思而不學則過擬合【 AI 思辨法則 】

寫出這句話我還是很滿意的,隨手就把企微簽名改成了 "學而不思則欠擬合,思而不學則過擬合",沿用至今。

接下來的術器我是這樣總結的:

  • 術 創造 AI 的化學方程式 -> 不同條件下發生不同的物理化學反應【 AI 鍊金術 】

  • 器 金子純度不高,一定是雜質提純的還不夠 -> AI 判斷不準,一定是資訊提供的還不夠【 AI 點石成金 】

像 Scaling Law, Prompt Engineering, DPO 等等,左右也不過是術器的一種,佐以各種奇淫技巧,目的相當統一,無非是想要 AI "道法自然"。

然而,想讓 AI "道法自然" 何其難,像 OpenAI 的 o1 和難產的 GPT5,也只是把快思考和慢思考拆開,學和思之間並沒有找到平衡點。

所以 o1 釋出不久後,我就寫了個分享來表達對 o1 的看法,思考一些應用和落地的方向。

所謂知行合一,不久後,我也在私有模型上覆刻實現了一套 o1 式推理,開啟資料飛輪新正規化。

邊工作邊寫些積累的技術分享總結,兩年不知不覺,也攢了不少文章。

當時想做 "從入門到'放棄'之玩轉 AI" 這個專題,也只是覺得有趣,卻沒想到做著做著,居然也攢下來十幾篇。

要說有什麼遺憾,可能是一直在趕釋出上線落地應用,沒空等待漫長的專利申請期,有幾次想寫的專利然後又放棄了。

所幸年底 OKR 總結完,在一些方向上又有了新的突破,正好有過年的空檔期,在應用前,把方案做出來,順手也就寫了篇專利申請,就當是一種體驗吧。

生活

九年長跑,今年領證,有種水到渠成的長情。

過往的記憶翻出來仔細晾曬,像陽光下的冬被,散發著暖洋洋的香氣,歲歲凜冽的寒風只是當年。

比較有意思的是,520 那天,正逢南山區副區長來視察,就現場隨機抽了三對新人由領導親自來頒證合影留念。

不巧,我是這三分之一。

今年也重啟了跨國之旅,畢竟番劇裡的日本,總感覺如霧裡看花那般不真切。

去寒山寺許下對抗八岐大蛇的佛門不壞金身,又懷揣著受輻射進化成超級賽亞人的期待,寒山拾得問裡,一時間只剩下中二的心猿意馬。

從 INTP 臨時小小 J 了一把,發現 J 得可怕。

雖然最後也沒有嚴格按照執行,但是就像有了定海神針般的輕鬆自如,從關西闖關東,JR,地下鐵,輕軌,電車,高速巴士,新幹線,等等,拿來就坐。

而所謂 "精神の壓抑の臥軌" 的笑談,也是真的。

好像只有宇治在這大阪京都東京的忙碌間,遺世而獨立,能看見生命綠色的活力,雖然是暮年,一時間腦子裡就只剩下 "生機勃勃的老年人,死氣沉沉的年輕人" 在迴盪。

那時朋友圈裡還不是千篇一律的 "差不多冬至",而是遠看富士山下的朦朧,如夢幻泡影,是近看有馬金湯的霧氣,如露亦如電,恍然間又再回想起寒山拾得問,且再待幾年,再看再說。

於是轉手就收藏偉人精裝鉅作,閒來細心研讀。

何以解憂,唯有毛選。

今年還重啟了演唱會計劃,一口氣看了鄧紫棋,RADWINMPS,告五人,汪蘇瀧,Charlie Puth 的演唱會,回想起所謂的 "口紅效應",可能如今已經悄然變成 "演唱會效應"。

雖然這樣,但是站在演唱會場館面前,你只會想到,錯過了 2002 的 Start,錯過了 2003 的 Soul Power,錯過了 2004 的無與倫比,錯過了 2008 的 Music Man,那就從把握現在開始吧!

而年度歌手,也沒有意外。但今年新增收藏的黑膠裡面,最喜歡的,大抵還是這張。

面對《鈴芽之旅》商業化模板的成功,面對《你的名字》跨越時間的愛戀,為了 "你" 勇敢一次而對抗全世界,沒有既要又要的大圓滿,只有直面操蛋的生活,就是在歲月成長中逐漸流失的勇氣吧?

今年還新增了一個新技能,自制冰滴咖啡。

在外面小資的咖啡店被宰多卻又戒不掉以後,我突然想,好像也不難,不妨先學一學?

於是就成功了,復刻的味道,我就只能說,一喝一個不吱聲,想純享還是拼配,都看心情,至此開啟新世界。

總結

新的一年,新的願望。

如果成為幸運之神在人間的代言人,應該會比天氣之子更酷吧?

或者是假裝成為一隻 llama,攪動開源世界風雲?

寫下這篇年度總結時,正逢十年基友,初為人父,在此送上誠摯的祝福。

突然想起十年前他在隨筆中寫下讓我惺惺相惜的那句 "那些曾經升騰著溫溫熱氣的奔跑,那些青春張揚放肆的日子,那些什麼的,都會過去的。"

是的,那些家丁贅婿爭鋒的日子裡,剛聞唐三昊天錘破萬法,又見蕭炎逆伐納蘭嫣然一戰成名,曾經還在絞盡腦汁臨摹中小學生滿分作文大全做 "預製菜" 的乾癟日子,突然遠了,且喝茶去。

待到回甘,才發現,是文理雙修的李三思,跨過了山海歲月向我走來,海城的夏天有著名為青春的味道,少年心事當拏雲。

而其他配角,"他們之所以沒有結局,是因為他們就分散在我們身邊,也許你在出家門左拐,也許你在街區閒逛,也許你乘坐公車面對面兩輛錯過的瞬間,也許地鐵門關閉飛馳的剎那,也許在飛機上你座位的身旁。也許和你同一個城市,也許在你去旅遊的地方,還也許在你們今夜的夢裡面。那些人們,他們就在那裡。等待著你們的遇見或者擦身而過。然後就這麼陪你們走過似水流年。"

"故事就這樣結束了。至於你們問我的很多問題,我知道,我也清楚,我更明白。如果你們覺得這所有的堅持和守候都等到了最後的答覆,這幾年的所有一切,都可以拋之腦後了。好好睡一個覺,明天一覺醒來,太陽會照常升起。"

"我只是你們生命中出現的一個說故事的人。娓娓道來,說那些時光和感動。有一天我們年華老去,你們還可以找上我,說,嗨,小豬,當年你的故事。曾經讓我感動過。從今天走向以後,在這個沒有英雄的時代裡,我希望你們都成為英雄!關於生活,關於睿智,關於事業和家庭。成為不被生活壓垮的英雄。"

世界太無趣,新的一年,就祝願大家,可以更有趣一點吧。

與世百無聊賴,不如退而結網。