有道子曰推理模型“子曰-o1”釋出即開源,14B小引數復現OpenAI o1強推理效果

新闻助手發表於2025-01-22

2025開年,AI行業掀起大模型“推理潮”,自OpenAI釋出o1後,各式推理模型不斷湧現,模型的高階推理能力迎來爆發增強,其應用價值也愈發獲得業界的廣泛關注。

1月22日,網易有道正式推出國內首個輸出分步式講解的推理模型“子曰-o1”。作為14B輕量級單模型,子曰-o1支援在消費級顯示卡上進行部署,採用思維鏈技術,能夠提供細緻解題過程,以強邏輯和推理能力,實現更高的解題準確性,並提供中文邏輯推理。據悉,子曰-o1正式對外開源,將助力教育領域推理模型的廣泛應用及創新。

著眼當前的“推理潮”,以更長的思維鏈路實現更強的邏輯及推理能力,成為推理模型的主要技術思路,在此引導下,特性不同的模型層出不窮。這其中,可供應用的開源模型卻不多,且引數規模較大,無法在低視訊記憶體的消費級顯示卡上執行,即使是採用了低位元量化技術,使其能夠在單卡上部署,但相應也為長思維鏈的執行帶來了不穩定性。

針對這一問題,子曰-o1開源模型選擇了較小引數規模的基礎模型,能夠進行單卡部署並具備更強的數學能力。在此基礎上,子曰-o1開源模型進一步實現了輕量化,能夠在消費級顯示卡上執行,並且提供與雲端部署質量相媲美的模型質量。

IMG_256

在規模“壓縮”的同時,子曰-o1採用思維鏈技術,打造了國內首個輸出分步式講題的思維鏈模型,以14B小引數規模可復現OpenAI o1的單模型推理能力。據悉,子曰-o1在解題時會形成較長的思維鏈條,使其執行思路更接近於人類的思考方式,透過“自言自語”、自行糾錯的方式,提供分步解題過程及最終結果。作為教育垂類模型,子曰-o1的這一特性也與教育應用產品更為適配,透過清晰呈現有條理的解題過程,以啟發式講解引導學生實現自主思考能力提升。

IMG_257

不僅如此,面向教育領域應用,子曰-o1在長思維鏈所實現的高準確度上,進一步從資料篩選、訓練指令等方面最佳化。透過應用有道自研的自動化評估方式,子曰-o1不僅對最終答案的正確性進行評估,同時還覆蓋了整個講解過程,確保學習資料的高質量。

在訓練指令選擇上,基於有道多年來在教育領域的資料資源積累,子曰-o1使用了大量的教育領域學生試卷習題為訓練樣本,從而提升教育場景應用的準確性。

當前,子曰-o1已在網易有道旗下的AI全科學習助手“有道小P”中落地應用,支援其實現“先提供解析思路、再提供答案”的答疑過程,引導學生使用者主動思考、呼叫知識儲備自主解決問題,從而實現真正把知識學透。在輕量化、輸出分步式講解、中文邏輯推理等多元優勢的加持下,子曰-o1能夠進一步賦能國內AI教育應用提質增效,以更低的落地門檻撬動更高的應用價值。

作為教育垂類的推理模型,子曰-o1的推出也進一步夯實了網易有道在教育大模型領域內的先發地位。在2023年7月,網易有道推出國內首個教育大模型“子曰”,並在一年內推出了10餘個應用,覆蓋了翻譯、作文批改、語法精講、句子解析、體育教育、口語練習、家庭輔導等多個細分場景。2023年11月,有道子曰教育大模型順利透過雙新評估,成為首批透過完整國家備案的教育大模型。 2024年7月,有道子曰教育大模型成功透過中國資訊通訊研究院的教育大模型評估,榮獲4+級證書,成為國內首批透過該項評估,並獲得當前最高評級的企業。

堅持“場景為先”,有道子曰教育大模型作為教育垂類大模型,已經擁有較通用大模型更為專業的預訓練語料,可以依據使用者在學習場景下的需求,幫助使用者答疑解惑。伴隨著推理模型的賽道持續擴大,網易有道在教育垂直領域內的深耕沉澱,也將賦能其在教育垂類模型的深入探索,以子曰-o1為起點,持續釋放推理模型在教育領域內的應用價值。

歡迎訪問Demo地址體驗:https://confucius-o1-demo.youdao.com/

附:模型下載地址

https://huggingface.co/netease-youdao/Confucius-o1-14B

https://modelscope.cn/models/netease-youdao/Confucius-o1-14B

相關文章