清北爸爸李永樂都搞不定的事情,這個隱身的大模型在發起挑戰

机器之心發表於2024-06-03

最近有個熱點新聞 ——「清北畢業爸爸輔導孩子數學也抓狂」。點開一看,新聞主角居然是李永樂老師。要知道,李永樂老師本科北大、研究生清華,現在還是人大附中的物理老師和知名的科普博主。如果連他都輔導不了自己的孩子,普通家長該有多崩潰。正所謂「不寫作業,母(父)慈子孝;一寫作業,雞飛狗跳」。在輔導孩子這件事情上,似乎沒有多少家庭能做到心平氣和。

圖片

巧的是,就在同一天,一個 AI 輔導孩子的影片也吸引了很多家長的注意。影片講的是一位父親在大模型的幫助下與女兒共同檢查數學試卷。其間,大模型透過一問一答的方式,引導孩子獨立思考,一步一步得出了正確答案,並指出了問題所在。有的家長看後評價說,「講得可真細緻,比我強多了」。清北爸爸李永樂都搞不定的事情,這個隱身的大模型在發起挑戰

據悉,這是猿輔導旗下飛象星球釋出的大模型場景測試影片。從釋出時間來看,該場景測試距離猿輔導看雲大模型正式透過備案,僅用了 15 天時間。要知道,大模型最難的是找到對使用者有價值且大模型可以實現的場景,而猿輔導這一場景測試是找到場景再做技術研發,被其內部稱為「拿著釘子找錘子」。

也正因如此,猿輔導看雲大模型並不會像那些廣為人知的通用大模型一樣成為獨立的應用產品,而是一個技術底座,隱藏在其產品互動的背後,為學生和家長提供服務和支援。

大模型對我們來講是『技術』,不是『產品』,它應該在產品中發揮價值。」猿力科技 CTO 楊元祖如是說。

其實,在教育領域,大模型能否讓大家看見並不重要,關鍵在於它能否有效解決學生和家長面臨的問題。作為一家自 2014 年就設立了 AI 實驗室的教育科技公司,猿輔導在應對這些問題上擁有自己的獨到見解和優勢。

學生和家長需要什麼樣的大模型?

學生需要什麼樣的教育?其實早在兩千多年前,孔子和蘇格拉底就給出了答案。

圖片

孔子的理念是「不憤不啟,不悱不發」。也就是說,教導學生時,不到他冥思苦想仍不得其解的時候,不去開導他;不到他想說卻說不出來的時候,不去啟發他。可以看出,孔子反對「填鴨式」教學方法,主張透過激勵、誘導、啟發的方式,刺激學生的學習主動性和積極性。

這種啟發式的教學方法也是蘇格拉底所推崇的。他主張不要把學生所應知道的原理直接教給他們,而是從學生所熟知的具體事物開始,透過師生間的對話、提問和討論等方式來揭示學生認識中的矛盾,刺激學生在老師幫助下尋找正確答案,使其得出正確的原理。

這種循循善誘的啟發式教學聽起來簡單,但對於家長來說難度很高。首先,家長的知識儲備可能跟不上孩子的學習節奏。很多家長表示,小學的題自己就已經做不了了。還有的家長表示,自己會做,但不知道如何以孩子能聽懂的方式講給孩子。

在 ChatGPT 等大模型問世後,一些家長也想過讓這些大模型 APP 充當孩子的家教。但同時,他們也擔心孩子們直接去問模型答案,省去中間的思考過程,這和直接讓孩子看練習冊後面的答案區別不大。因此,一種折中的方式是家長先透過模型自學,再去教孩子,門檻依然很高。

此外,孔子還有一個很難被貫徹的理念 —— 因材施教。在學校,每個老師要負責幾十甚至上百名學生,很難關注到每個學生的差異,因此制定的教學計劃、佈置的作業往往是高度一致的。家長對此也是無能為力。這可能導致學生的學習效果和興趣受到影響。

因此,總的來看,學生和家長需要的大模型至少要滿足兩個要求,一是要會啟發,二是能幫助孩子定製學習計劃。在成立之後的十幾年裡,猿輔導其實已經打造了一系列旨在滿足這些條件的產品,比如海豚 AI 學、猿輔導素養課、小猿學練機、飛象星球、斑馬 App…… 但現在,大模型的出現給了他們一個契機,讓他們有機會把這些產品全部升級到 Next Level。

圖片

不給答案還反問,「反骨」的教育垂直大模型

儘管當前通用大模型已展示出巨大的應用潛力,但不得不承認,教育的複雜性在於其高度依賴人際交流,尤其是學習新知識時。由於缺乏在教育垂直領域的資料及行為積累,通用大模型的產品邏輯並不能很好的適應教學輔導場景,下面這個例子恰巧證明了這一點。

當孩子遇到了不會做的數學題,如「甲、乙兩人同時從 A、B 兩地出發,相向而行。相遇時,甲與乙的路程之比為 7:5,若甲比乙多走了 200 米,則甲走了 () 米。」假設孩子不會寫調教大模型的提示(比如:「回答的內容是給 10 歲的孩子看的」),而是直接把問題拋給通用大模型去做,我們看看會發生什麼:

圖片

圖片

就過程和結果來說,兩個模型都沒有答錯。但從輔導孩子的角度來看,他們給答案的方式還是過於直接了,第一個大模型給出的解法甚至是超綱的。

猿輔導的教育垂直大模型卻反其道而行之。當孩子把同樣的問題拋給猿輔導旗下的海豚 AI 學時,AI 學習夥伴「小白」會透過多輪問答,引導學生逐步解疑,主動思考。該功能被稱為「蘇格拉底啟發式 AI 答疑」。

圖片

此外,在作文等主觀題中,通用大模型與教育垂直大模型的差異就更明顯了。相較於直接生成「範文」或者給出幾個方向的提示詞,教育垂直大模型則更懂得如何提升孩子的底層能力。在猿輔導看雲大模型加持下,飛象星球可以透過多輪啟發式對話,幫助孩子理解題目、發散思維,引導其逐步列出作文提綱併成文;猿輔導素養課的 AI 作文批改,則能從審題、立意、語句、詞彙等各個維度進行評價,並生成一份詳細的報告,讓孩子瞭解自身的優勢與不足。

圖片

圖片

不難看出,教育大模型不僅是互動的、主動的,還是個性化的。隨著時間的推移,這些產品會為每個孩子建立起學習大資料庫,開啟真正的個性化學習時代。

「大模型肯定是教育解決方案接下來改進的最大變數。假設沒有大模型,我們也會一直迭代我們的產品,但相對來說是比較漸進的。但大模型理論上來說帶來了全新的變數,使得我們可以重新審視教育解決方案,從這個角度說再怎麼重視都不為過。」楊元祖在接受多知網的採訪時談到。

不過,重視歸重視,對於一家教育類公司來說,在這麼短的時間內做出一款能落地多款應用的大模型顯然是非常不容易的。但如果把他們當成一家 AI 公司來看,一切就順理成章了。

猿輔導:既是教育公司,也是 AI 公司

猿輔導的 AI 基因可以追溯到 2014 年。當時,他們成立了業內首個 AI Lab,在教育領域獨樹一幟。其實,在 AI 領域,這個時間也是非常早的,距離 Hinton 等人在 ImageNet 挑戰賽中拿到冠軍僅僅過去了兩年,而李世石與 AlphaGo 的對弈兩年後才會發生。

在成立後的 10 年裡,這個 AI Lab 在語音、視覺及自然語言理解等方面做出了很多成果。2018 年,他們在史丹佛問答資料集水平測試上戰勝了 Google;2019 年,他們探索出了基於深度學習模型的數學應用題自動解題模型;2020 年,他們出版了《深度學習核心技術與實踐》一書;2021 年,他們的語音合成技術獲 ICASSP M2VoC 國際賽事多說話人多風格音色克隆大賽榜首……

追根溯源,猿輔導的很多產品都是在這些研究的基礎上構建起來的,比如猿題庫、小猿口算、小猿搜題…… 所以,說「猿輔導本質上是一個 AI 公司」其實並不為過。

但同時,作為一家教育公司,他們又有很多 AI 公司所不具備的優勢,其中最明顯的就是資料。

正如我們前面所說,教育不是給個答案那麼簡單,背後有自己的規律和方法論。而這些規律和方法論,就藏在每一張試卷、每一個教學影片裡。透過資料及行為積累,大模型可以知道怎麼去拆解每一道題目,怎麼按照學生的認知水平選擇合適的講解方式。

而這樣的資料,僅猿輔導旗下飛象星球就積累了上百 TB,其中包括文字資料 30TB、圖文資料 90TB。此外,他們還有 500 萬小時的教學影片資料。可以說,猿輔導擁有行業體量最大的高質量教育資料集。在大模型技術趨同的今天,資料積累將在很大程度上決定猿輔導及其競品所打造的教育大模型的上限。

手握這些資源,猿輔導對於自家大模型有著非常清晰的定位。「我們的大模型要更加符合教育領域,比如說更會做題,更擅長以一個老師的方式來掌握知識點。通用的大模型可能對於語言的理解能力是很強的,但它對語言的理解能力是一個普通人的理解能力,不是一個語文老師的理解能力。普通人和語文老師看待同一句話、同一句語言的視角不一樣,這是兩者的差異。」楊元祖解釋說。

為了繼續挖掘大模型在教育領域的潛力,猿輔導下一步打算在多模態大模型上持續發力。因為,教育對於原生多模態的需求會遠大於其他領域,這是一種自然而然的選擇。

從技術到應用,教育大模型還有很長的路要走

如果從 AI 公司的角度來看,猿輔導有很多不一樣的地方。在百模大戰如火如荼的階段,他們沒有急於推出一款大模型,而是在理清了大模型的能力和學生、家長的真實需求之後再重點打磨,然後將其作為技術底座與現有產品深度融合。這是一項系統工程,背後需要對教育、對 AI 都有很深的理解。

不過,從飛象星球本次曝光的影片來看,猿輔導的大模型還處於測試階段,還沒有「完完全全地落地」。誠如業內人士所言,大模型時代仍處於早期階段,垂直大模型的落地應用也有待市場進一步檢驗。只是,我們幾乎可以預見,誰能夠把教育大模型場景應用這一環節的痛點解決得最好,誰就有可能佔據教育數字化的制高點。

教育大模型的出現,不僅僅是技術的革新,也是思維的解放,它讓人們重新思考教育的目的,重新定義師生關係,重新配置教育資源。透過將先進的大模型技術整合進其教育產品中,猿輔導將推動一對一優質教育資源的普及,助力縮小城鄉、貧富之間的教育資源差距,實現讓更多孩子享受到高質量教育的美好願景。

參考連結:https://xueqiu.com/7423950559/290805667

相關文章