獨家對話李巖:宿華、經緯、紅點資金支援,第一個「生成式推薦」創業公司|AI Pioneers

机器之心發表於2024-07-18

圖片

人類正在迎來人工智慧領域的爆炸式更新,技術向未知擴充的每一步,幾乎都引起驚人的關注度。

在人工智慧邊界擴張的過程中,重要賽道的技術路線創新與分歧並存。技術先鋒者的判斷和選擇,影響著眾多跟隨者的腳步。

過去一年,機器之心獨家率先將月之暗面、生數科技、愛詩科技、無問芯穹等優秀公司介紹給大家,為他們在網際網路世界留下了第一份 “萬字訪談底稿”。在技術路線尚未收斂的階段,我們看到了到真正擁有信念、勇氣以及系統化認知的 AI 創業者的引領力量。

因此,我們推出 “AI Pioneers” 的專欄,希望繼續尋找和紀錄 AGI 時代人工智慧各細分賽道具有領袖氣質的創業者,介紹 AI 賽道最出眾、高潛的創業公司,分享他們在 AI 領域最前沿、鮮明的認知。

圖片

作者:姜菁玲

機器之心報導

離開快手創業後,「李巖」悄悄拿到了快手聯合創始人宿華、紅點創投以及經緯創投的3200萬美金種子輪融資。

作為快手初始AI體系的核心人物,李巖曾搭建了快手內部第一個深度學習部門,後來還幫助快手搭建起了多模態內容理解Multi-Media Understanding 技術體系。

他的其中一位投資人總結,在教授學者、移動網際網路實幹派,以及學術小天才,這三派AGI創業畫像裡,元石科技是唯一有能力整合「多模態、搜尋、推薦」這三大核心技術棧的團隊。

不過,自2023年初李巖正式確認自己創業後,一年多來,他就幾乎消失了。

過去一年中,我們向李巖團隊發出過多次採訪邀請,希望跟他聊聊他的創業想法,都被「產品尚未準備好(公開)」婉拒。

不久前,元石科技的產品「問小白」正式上線,冷啟動內測開啟,這也是李巖團隊第一次創業進展披露。於是我們再次找到李巖,希望和他聊聊他的創業計劃。

在這次獨家專訪中,出乎意料的是,李巖的選擇並不是一個純模型公司,甚至也沒有從多模態方面切入。

在「問小白」這個產品中,使用者開屏即在「feed」中,看到由AI針對使用者興趣個性化生成的AIGC內容,並可隨時用「chat」功能與AI基於內容做更多的互動。
圖片
可以理解為,這是一個基於自研LLM模型的生成式內容社群產品,與此前的內容社群產品相比,李巖的動作在於「生成式推薦」。

這是一個前沿的技術研究領域,至今只有Meta與CMU有一些落地成果。他告訴我,相比於之前的推薦演算法,生成式推薦演算法將不再基於協同過濾的推薦系統,推薦將變得更加智慧,從當下的「千人十面」變成真正意義上的「千人千面」。

透過對使用者更深層次需求的挖掘,推薦效率得到進一步提高,使用者能夠得到與自己更匹配的資訊。而且,大量高質量語料對大模型的灌輸,讓生成式推薦演算法擁有「價值觀」。可以不再僅僅只是「討好」使用者,而是引導使用者關注真正需要關注的優質資訊。

目前在國內,李巖團隊是首家以LLM驅動的生成式推薦演算法作為產品核心和發展方向的創業公司。

元石的一位投資人認為,這種新的技術引擎在內容行業帶來的成本與效率上的最佳化,與今日頭條的成功路徑基本一致。而在做生成式推薦演算法產品這條路上,「我們看到,同時具備多模態、搜尋、推薦三種背景的團隊可能只有李巖」。

Vision:做一個更高維度的推薦演算法

機器之心:我們先來介紹一下元石科技希望做一件什麼事?

李巖:我們希望透過技術創新,匯聚智慧,幫助使用者進入心流狀態,對抗精神墒。(來自米哈里·契克森米哈賴的“心流”理論)

機器之心:有點抽象,能否再解釋下?

李巖:我們覺得當下是一個資訊爆炸的時代,接收資訊的渠道很多, 但是真正能夠獲得自己關心資訊的渠道缺失了。

比如最近的WAIC,可能你會看到鋪天蓋地的報導但是每篇報導都是隻言片語,但你並不能獲取到你真正關心的資訊,這時候你反而會陷入一種焦慮。

我們理解這是一種「精神熵」,這個概念是一個心理學家米哈里·契克森米哈賴提出的,跟我們希望做的事情非常準確地匹配。我們想做的事,就是幫助大家提升看到資訊之後的幸福感和收穫感。這種狀態跟當下我們重度使用一些資訊類產品過後的「更焦慮、更疲憊、更開心」會有所區別。

機器之心:什麼樣的資訊會讓人看到更幸福、更有收穫,而不是更焦慮、更疲憊?

李巖:這裡有一個「心流」的概念,它指的是,人只有看到自己真的想看到的資訊的時候,才會進入心流狀態,從而感受到幸福,而不是去看到很多跟自己無關,或者不感興趣的事情。

這同樣是一個心理學研究結果,舉一個具體的例子,比如父母讓小孩寫作業,雖然最終是落實了,但小孩是被動的,他非常痛苦,他只有在做自己想做的事情的時候,他會覺得自己很快樂。所以我們希望幫助使用者進入心流的狀態,去對抗精神熵。

圖片

機器之心:現在其實大部分社交社群的底層推薦系統,本質上也是希望實現這種目標(給使用者推ta真正想看的)?

李巖:是有區別的。假如我們站在十年後,2034年看今天的推薦系統,包括產品和背後的技術,其實是非常落後的。現在產品所做的這些,其實並沒有實現一個很完美的狀態。

機器之心:怎麼理解目前的水平和「更好」的水平?

李巖:我可以做個類比,目前的資訊分發更像是原始人類階段的本能反應,在精神並沒有太豐富的階段,可能人的本能就是「我要吃飯」、「我要哭」、「我要笑」,這樣很直接的。

反應在推薦系統裡,可能就是,比如你喜歡帥哥,就會一直給你推帥哥——推薦系統並沒有過多的深入思考。而我們的產品希望做到的是,不是對使用者本能反應的討好,而是帶著更高的智慧,帶有關心和愛的推薦。

機器之心:這個聽起來是一個審美上更高的維度,有點想要「教育使用者」的意味。

李巖:準確地說並不是教育。很多事情在一個比較短的週期去看,是看不清楚的。但是比如說我們拉長到整個人類發展的歷史上去看,我們會發現人類文明的每一次前進都會伴隨著批判、反思甚至推翻、重構,一些東西在當下是看起來不錯的,但在未來這可能就是有侷限的。在網路世界也是這樣 ,我們希望把更文明的成分,人類所積累的先進思想帶到內容分發當中去。

圖片

技術實現路徑:選擇更高質量的資料訓練模型,讓模型有價值觀


機器之心:剛剛說是希望做一個幫助使用者更好實現心流的內容產品,為什麼會從做一個更好的LLM這件事著手?

李巖:我們認為LLM是通往AGI非常重要的節點。大語言模型可以做到,更好的去理解使用者、理解內容,知道使用者關心什麼、喜歡什麼、不喜歡什麼,使用者個人的所有的興趣愛好可以tokenize,而大模型可以很好的去理解。

之前的推薦系統是無法做到這種程度的理解的,它只能給這個使用者打上很多離散的標籤,透過這個去嘗試刻畫和理解使用者。現在,大模型不僅可以更好理解使用者現有興趣,還能增強對使用者興趣的挖掘,推理出使用者隱性的興趣愛好。

有了大模型之後,我們能夠對全網際網路上最高質量的語料進行壓縮,對承載在文字裡的人類文明進行壓縮,從而使用這些文明,進一步將這些能力用到生成式推薦上,它就會擁有它的價值觀、世界觀,從而有一個更高維度的推薦價值體系。

大模型其實是承擔了一個橋樑的作用,把這些最先進的認知與你的資訊消費連結起來,然後進一步提升你的內容消費水平。

機器之心:這些「先進」內容指的是論文是嗎?是社會科學還是自然科學方面都包括還是偏向哪方面?

李巖:大模型會讀取整個網際網路上人類積累的所有先進文明和資訊,它在方方面面都可以是先進的。

機器之心:大模型怎麼判定什麼是「先進文明」?

李巖:其實我們人類已經對這件事情做過判斷,而不是大模型,比如說我們權威的論文期刊、知名學者寫的書,這些並不是大模型界定的,而是人類自己長期以來建立的高質量資訊。

機器之心:嗯嗯,那這部分高質量資料具體是什麼呢?來源?

李巖:我們看重資料驅動的模型能力建設,在我們模型裡面,我們利用演算法將可利用的高質量資料數量提升了超過一個數量級以上。另外,在資料的選擇上,我們更多地採用,經典的書籍、理論、論文,這樣的資料去訓練我們的大模型,從而使得我們的模型有了更加深度理解使用者的能力,更具體來講,在內容推薦這件事上,我們不會一味讓使用者停留在短期快感內。而是同步有積累高質量資訊的長期快樂。
圖片
機器之心:剛剛提到生成式推薦演算法可以提高對使用者理解程度,不同推薦演算法對使用者理解程度有沒有量化的標準可以比較?

李巖:由於不同公司追求的目標是不一樣的,因此最佳化目標也不一樣。一般來說可能是時長、點選率以及留存。由於我們技術原理和業務方向是全新的領域,因此我們目前內部有一套非常複雜的資料體系,去評估這件事。

機器之心:在LLM上,目前元石技術上有什麼優勢?

李巖:我們從公司成立第一天開始,也就是2023年4月份左右,第一個版本的大模型就是MoE架構的。整體的技術路線選擇在市場上是有很多的前瞻性。從2023年4月份到現在一年多時間,我們的模型已經迭代了四個版本。在很多公開的測試集上,我們的效果比很多其他模型的表現要好。

另外,我們高質量語料讓回答的質量非常高,模型有深度思考的能力。第三,我們大模型速度也非常有競爭力,延遲極低。我們透過對模型訓練和推理做了極致的最佳化,讓我們訓練大模型的成本大大下降,我們現在是免費的,不需要大家在高峰期給使用付費。

機器之心:為什麼你覺得MoE是更優越的路線?

李巖:我們認為,要做自己的產品,需要有模型底層一體化鏈路的能力,大模型時代模型效果更好,往往意味著它引數量就大了。但是作為一個to c的產品,如果模型推理的成本很高,那商業上是不work的。所以我們既需要引數量很大,又需要推理成本很低,作為商業上可行的前提,最終我們只能選擇MoE。我們是從第一天就想清楚了這個問題,我們寫下的第一行程式碼就是MoE的。

機器之心:因為元石定位是一個應用公司,在研發過程中有沒有考慮去使用一些開源模型,這樣可能會更經濟一點。

李巖:我們的目標並不是做一個模型層的公司,但我們還是選擇自研大模型的原因在於,我們認為其他人的模型並不是為我們的目標服務的,我們是一個由自有大模型驅動的產品公司。

我們沒有在模型層的商業模式上做過任何嘗試,這跟我個人的認知有關係。有的人認為大模型是水和電,就是說我一旦做了好大模型,你們就不需要做了,都呼叫我的能力。但我們認為大模型更大的意義在於說極致服務使用者的能力,場景化的能力,它在一個固定的場景,把使用者服務的更好,提供了之前完全沒有的體驗。

另外,事實證明微調改變的能力是有限的。因為我們做這個事情的創新性還挺大的,需要在底層模型架構上做大的改動。我們內部也會用我們自研的模型跟開源模型去比,事實證明,我們內部自研的效果要遠遠好於開源模型。因為這個模型是完全為我這個場景打造的,從訓練資料的構建以及演算法的設計都做了很多工作。

機器之心:你個人在多模態方面也是屬於國內探索的比較早的,在多模態方面有時間表嗎?

李巖:目前文字大模型還是核心中的核心。是智慧的基礎。

圖片

產品價值:能夠更關注使用者的個性化需求


機器之心:元石科技產品形態其實跟市面上幾乎所有大模型C端產品都不一樣,為什麼會想要定義這樣一款產品?

李巖:我們不是一個針對特定人群的產品,我們面向廣泛的人群,我們也不是一個垂直內容社群。我們認為隨AI生成能力和分發能力的提升,AI時代未來的內容垂類的邊界甚至會越來越模糊。

在產品層面,目前我們產品有兩個功能,一個是Feed一個是Chat。我們叫「問小白」,一個方面就是使用者生活中有什麼問題,都可以去問ta。另一方面是由小白「問」,基於使用者問AI的問題,小白也會主動關心使用者,主動給使用者推送。名字叫小白,是希望使用者有安全感,親切感,拋棄掉冷冰冰的AI或者暴力的AI,跟使用者是可以近距離接觸的。

機器之心:所以可以把它理解成一個帶有AI功能的內容產品嗎?

李巖:可以,在此之外它還是一個實時線上的瞭解你喜好的朋友,那作為使用者你有事你可以安排它去做,沒事它可以觀察你,看能幫到你什麼主動做點事情。

機器之心:Feed流的內容全部是AIGC的嗎?怎麼保證這部分內容的質量?

李巖:用大模型生產內容的話,它首先是需要知道使用者喜歡什麼樣的內容,再針對這些議題去生成,高質量地組織文章內容。這兩個層面一方面是理解能力,一方面的生成能力,現在來看的話,這兩方面的能力大模型都還有很大的提升空間。也是之所以創業的原因,因為我們認為自己有能力去將這個事情實現極大的提升。

圖片

機器之心:產品看起來有點像AI版的知乎、小紅書、頭條,相比於這些,區別和優勢是什麼?

李巖:我們首先是更關注使用者的個性化需求。上一代你剛才講的所有的產品,他們推薦系統的最基礎原理是協同過濾,就是說一個使用者喜歡A又喜歡B,另外一個使用者喜歡A又喜歡C,那麼B和C也是類似的。那我們就分別把B和C推薦給你。這種協同式的過濾手段存在非常明顯的問題,就是總給你推薦一些頭部垂類。

為什麼呢?是因為你喜歡任何一個topic,大機率都跟喜歡這個topic的其他人,一樣都更傾向於喜歡美女帥哥,都傾向於喜歡娛樂。所以系統最後就會認定其實你是喜歡娛樂、喜歡頭部帥哥美女的。

這種方法它有它的好處,可以快速地拉動使用者時長持續增長。但它的問題是,它使得使用者個人興趣、小眾興趣被埋沒了,很難細緻地理解使用者。

而我們是基於大模型去做這件事情的。我們首先是希望能夠照顧到你的個性化興趣,而不是一律給你推頭部帥哥美女或者娛樂內容,這樣的話,這個推薦系統也並不是真正個性化的推薦系統。

所以,一個足夠智慧的推薦系統,它理論上是應該能照顧到使用者所有的興趣的。就無論是你大眾層面的興趣,還是小眾個性化的興趣。目前還做的遠遠不夠。

機器之心:創業的時候為什麼選擇這樣的一個方向,而不是目前常見的chatbot或者情感陪伴的產品形態?

李巖:我們認為,LLM融合推薦,有機會定義更全新的互動,一種無需「主動」互動的流暢體驗。目前純chat類的互動對使用者還是有一定的使用門檻,需要使用者主動發起提問。某種程度也限制了更廣泛使用者的滲透和使用。以及我們今天用的所有推薦類的產品,雖然使用者用的很多,但是我們還是看到了使用者反覆的卸裝。反覆裝說明他離不開,但是他反覆卸,說明他沒有百分之百滿意。這是一個點,讓我們認為推薦類的產品其實還是有很大的機會。

在這個基礎上,我們認為自己團隊的背景來做這件事非常契合,我個人及團隊擁有很深厚的搜尋、AI的研究和大規模產品化落地經驗。

圖片

機器之心:不過內容型產品目前普遍遇到商業化路徑不清晰,不是很成功的困局,在這塊您怎麼想?

李巖:目前還處於要更加充分地論證我們使用者價值的階段。在大的使用者價值上去談商業價值才有意義。大體量內容產品的超強變現能力,很多個產品已經給予了很成功的範例,比如快手。

機器之心:回到產品上看,回答能力越好對產品的價值意義在哪裡?

李巖:我覺得有兩個。第一個就是說你回答的越好,使用者粘度就會很高,這樣的話,你可以知道更多使用者的訊號,更瞭解使用者。最終,系統可以根據這些來為使用者創造它喜歡且真正需要的內容。持續形成正向的體驗和資料迴圈。

機器之心:樂觀去想,生成式推薦演算法的逐步成熟可能會對內容行業產生哪些方面的影響?在你的想象中,一個成熟的「問小白」可能是怎樣的?

李巖:生成式推薦給內容賽道注入新的活力,使得這個板塊有巨大變化成為可能,而不是精雕細琢式的改良。

目前大模型等相關技術突飛猛進,但人和AI溝通的瓶頸明顯,我們有能力把這兩個方面都做的更好。問小白,小白問,我們希望極大的促進AI技術的普惠,讓更需要AI的普通使用者感受到AI的力量。

相關文章