藏不住了！OpenAI的推理模型有時用中文「思考」

机器之心發表於2025-01-15

原文網址 : https://www.jiqizhixin.com/articles/2025-01-15-8

OpenAI模型

讓我們說中文！

OpenAI o1 在推理時有個特點，就像有人考試會把關鍵解題步驟寫在演草紙上，它會把推理時的內心 os 分點列出來。

然而，最近 o1 的內心 os 是越來越不對勁了，明明是用英語提問的，但 o1 開始在演草紙上用中文「碎碎念」了。

比如這道編碼題，前面 o1 還在老老實實用英語，後腳就進入了「中文時間」。

這波操作，怎麼看都像留子寫論文的反向操作：先用中文打草稿，再翻譯成英文交作業，倒反天罡了。

這件事先在 reddit 上掀起了一陣討論，匿名發帖者表示：「我只見過 Deepseek 的模型這樣做，但我不知道為什麼 OpenAI 的模型會突然偏向中文啊！」

神經科學 × AI 研究員 Rishab Jain 也在 X 上表示疑惑：「為啥 o1 突然開始用中文思考了？明明整個對話（5 + 條訊息）都是英文啊...... 很有意思...... 該不會是訓練資料在作祟吧？」

OpenAI 並未做出解釋，甚至都沒有承認這一現象。

谷歌的 Gemini 也出現了類似的行為。它會在段落中間隨機插入古吉拉特語（印度的一種主要語言）單詞。ChatGPT 也可能會用沒有出現在對話中的語言來定義網頁左邊列表裡整個對話的名稱。

這種多語言能力者的現象不只出現在推理或語言模型中，多模態模型也「躺槍」，有網友提到自己在跟 GPT-4o 對話的時候，它也會半途隨機：「讓我們說中文？」

那麼，這到底是怎麼一回事呢？

難道是 o1 套殼「QwQ」的事，藏不住了？

嗯，AI 專家們也不太確定。但他們先針對推理模型提出了幾種推測。

訓練資料的鍋？

Hugging Face CEO Clément Delangue 在 X 上轉貼，表示：「或許這是因為閉源公司在使用（目前是中國機構主導）的開源 AI 和開源資料集？」

他還提到：「未來在開源 AI 領域勝出的國家或公司，將在 AI 的未來發展中擁有巨大的影響力和話語權。」

「OpenAI 和 Anthropic 的實驗室都會使用第三方資料標註服務來處理科學、數學和程式設計方面的博士級推理資料，」RT-X 系列的主要作者、Google DeepMind 研究員 Ted Xiao 做出了進一步解釋，「出於專業勞動力可用性和成本考慮，許多這些第三方資料標記供應商都位於中國。」

而 o1 切換到中文可能是這種影響的一個例子。

軟體工程師 @ClaudiuDP 也表示：「可能是 AI 的訓練資料中裡，一些需要用來構建回答的資訊是用中文寫的。」

除了中文佔訓練資料的比重高之外，由於是中文是象形文字系統，一個漢字往往可以表達一個完整的概念，相比之下，英文可能需要多個字母才能表達同樣的概念。這可能也是一種「節省 token」的策略？

「AI 選擇用中文思考，是因為中文在某些表達上更經濟，可以直接解概念壓縮包？」

「在思維鏈中，同等 token，選中文能思考得更深？」

「與英語相比，中文壓縮了 token 的使用。我懷疑這是否是原因，但節省這些冗長的內部推理模型的成本是明智之舉。」

解起數學題來尤為直觀，比如小 A 還在卷子上拼「Quotient」，而旁邊的中國同學的「商」字已經寫完了。

選擇了最順手的語言？

然而，有些專家並不認同應該讓資料標註背鍋。因為除了中文，o1 突然切換到印地語、泰語等其他語言的可能性也很大。

他們提出了不同的觀點：「o1 可能只是在選擇最順手的語言來解題，或者只是單純的幻覺。」

「模型並不知道什麼是語言，也不知道語言之間有什麼不同，」阿爾伯塔大學助理教授、AI 研究員 Matthew Guzdial 對 TechCrunch 表示，「對它來說這些都只是文字。」

事實上，模型眼中的語言，和我們理解的完全不同。模型並不直接讀單詞，而是處理 tokens。以「fantastic」為例，它可以作為一個完整的 token；可以拆成「fan」、「tas」、「tic」三個 token；也可以完全拆散，每個字母都是一個 token。

但這種拆分方式也會帶來一些誤會。很多分詞器看到空格就認為是新詞的開始，但實際上不是所有語言都用空格分詞，比如中文。

Hugging Face 的工程師 Tiezhen Wang 認同 Guzdial 的看法，認為推理模型語言的不一致性可能是訓練期間建立了某種特殊的關聯。

他類比了人類的思維過程，會說雙語並不僅僅是會說兩種語言，而是一種獨特的思維方式：大腦會自然地選擇最適合當下場景的語言。就像用中文算數學比較簡潔高效，每個數字只需一個音節，但討論「無意識偏見」時卻自然切換到英文，因為最初就是用英文學習這個概念。

這種語言切換就像程式設計師選擇程式語言一樣自然 —— 雖然大多數程式語言都能完成任務，但我們還是會選擇用 Bash 寫命令列，用 Python 做機器學習，因為每種語言都有它的「最佳場景」。

「工具要看場合」，這也啟發訓練 AI 時也要讓它接觸多種語言，學習到不同文化中的獨特思維方式，這種包容性也能讓 AI 更全面，也更公平。

有許多 AI 專家與 Wang 的觀點不謀而合。

「在思維鏈推理過程中，肯定會冒出很多種語言，用哪種語言思考都行。就像我自己，當某些概念用英語很難表達時，我的思維就會自動切換到俄語。大語言模型就是矽基大腦，可能也是同理。」

「這是訓練過程中產生的一個現象。Deepseek 的 R1 模型也有同樣的表現。在訓練過程中，模型會搜尋那些最能幫助它得出正確結論的詞。而其他語言中的詞向量往往能更好地影響它的推理過程。」

同時，不少圈內人表示，既然切換語言對思考有幫助，而且使用者最終看到的還是英文結果，那這完全 OK。

「作為一箇中國人，我經常在腦子裡用英文思考，因為我是雙語者。所以我一點也不驚訝大語言模型會用中文思考，畢竟它們也是多語言通。只要最後輸出的是預期語言就行，我覺得這不能算是幻覺。不過，這是不是要進一步思考：最好的 AI 思考方式，是不是應該是一種與具體語言無關的隱藏狀態？」

「半路用中文思考」不是 bug，反而是一個意外的驚喜，說明 AI 出現了「以我為主，為我所用」的智慧湧現？

對此，你怎麼看呢？歡迎在評論區留下你的看法！

^{參考連結：}

^{https://techcrunch.com/2025/01/14/openais-ai-reasoning-model-thinks-in-chinese-sometimes-and-no-one-really-knows-why/}

^{https://x.com/RishabJainK/status/1877157192727466330}

^{https://x.com/ClementDelangue/status/1877767382120255792}

^{https://x.com/Xianbao_QIAN/status/1878623350953857166}

^{https://x.com/xiao_ted/status/1877503196811362504}

「DeepSeek接班OpenAI」，最新開源的R1推理模型，讓AI圈爆了
2025-01-21
OpenAI模型
OpenAI 推出迄今為止最先進的推理模型 o3
2024-12-21
OpenAI模型
重磅釋出：OpenAI o1全新推理模型系列
2024-09-19
OpenAI模型
終於來了！OpenAI開放GPT-4o高階語音，還用中文說「對不起」
2024-09-25
OpenAIGPT
推理水平對標OpenAI o1！阿里雲通義開源最新推理模型QwQ
2024-11-28
OpenAI阿里模型
京東藏不住本地生活的野心
2021-10-18
大魚思考---有關190億$的思考
2020-04-04
OpenAI是什麼 OpenAI有哪些優秀產品
2023-02-25
OpenAI
剛剛，OpenAI安全副總裁、北大校友Lilian Weng宣佈離職，有時間寫部落格了
2024-11-09
OpenAI
歷史時刻：DeepSeek GitHub星數超越OpenAI，僅用時兩個月
2025-02-07
GithubOpenAI
OpenAI Sora真的有自己的物理模型嗎？
2024-02-18
OpenAISora模型
OPENAI API應用文件
2024-04-28
OpenAIAPI
OpenAI工程師親自修訂：用ChatGPT實時語音API構建應用
2025-01-10
OpenAI工程師ChatGPTAPI
學會了 Vue，前端面試依舊沒有通過？你得好好思考了
2019-05-14
Vue前端面試
定時器引發的思考
2020-10-01
定時器
WebRTC 建立者剛加入了 OpenAI，他是如何思考語音 AI 的未來？
2024-11-27
WebOpenAI
沒有等來OpenAI開源GPT-4o，等來了開源版VITA
2024-08-14
OpenAIGPT
OpenAI o1式思維鏈，開源模型也可以有，成功案例來了
2024-09-17
OpenAI模型
基於OpenAI的程式碼編輯器，有點酷有點強！
2023-03-28
OpenAI
這家神秘的機器人初創，怕是藏不住了
2024-03-04
機器人
Design Thinking的適用性思考
2022-05-08
Thinking
Sebastian Raschka：關於DeepSeek R1和推理模型，我有幾點看法
2025-02-09
AST模型
考研數學得126分、還能編寫小遊戲，智譜首個推理模型來了，人人免費用
2024-12-31
遊戲模型
ChatGPT應用思考
2023-02-22
ChatGPT
都8102年了！是時候有個新的狀態容器取代redux了！
2018-11-02
Redux
一個遊戲運營的5年思考：運營到底有啥用？
2019-09-16
遊戲
OpenAI停服，國產大模型免費用！開發者Token自由實現了
2024-06-25
OpenAI大模型
epic堡壘之夜怎麼設定中文堡壘之夜設定了中文沒用
2022-05-10
應用監控的選型思考
2018-11-28
RAGFlow開源Star量破萬，是時候思考下RAG的未來是什麼了
2024-07-08
蘋果反水：OpenAI的1500億「史上最大」融資輪，難了
2024-09-28
蘋果OpenAI
超實用的時間管理工具：Things for Mac中文版
2023-04-12
Mac
有一點思考的2021年終總結！
2021-12-29
是時候擁有一個你自己的命令列工具了
2019-05-17
命令列
時間戳，這樣用就對了
2020-07-31
時間戳
有道子曰推理模型“子曰-o1”釋出即開源，14B小引數復現OpenAI o1強推理效果
2025-01-22
模型OpenAI
OpenAI正式推出ChatGPT的官方應用程式，可免費使用！
2023-05-19
OpenAIChatGPT
OpenAI 釋出適用於 .NET 庫的穩定版本
2024-10-06
OpenAI

藏不住了！OpenAI的推理模型有時用中文「思考」

相關文章