史上最強 AI 翻譯誕生了!拳打穀歌,腳踢 DeepL

米开朗基杨發表於2024-06-07

CoT 推理正規化

預設情況下,大語言模型通常是直接給出問題的最終答案,中間推理過程是隱含的、不透明的,無法發揮出大模型最極致的理解能力。如果你用它來充當翻譯,可能效果和傳統的機器翻譯也差不了太多。

如果我們給大模型設計一個合理的提示詞,控制大模型的思考方式,就能發揮出大模型的最大功效,甚至可以讓它的翻譯水平直線逼近 “信達雅”。

最近有研究者推出了一種新的推理正規化叫 CoT,也就是 “Chain of Thought” 的縮寫,意為 “思維鏈”

所謂 CoT,就是讓模型顯式地、系統地生成推理鏈條,展示從問題到答案的完整思考過程

舉個例子。

問題:約翰有 10 個蘋果,他吃了 3 個,又給了妹妹 2 個。約翰還剩幾個蘋果?

傳統模型的回答:5 個蘋果。

CoT 模型的回答:

  • 約翰原來有 10 個蘋果,
  • 約翰吃了 3 個蘋果,所以還剩下 10-3=7 個蘋果,
  • 約翰又給了妹妹 2 個,所以最後剩下 7-2=5 個蘋果,
  • 因此,約翰還剩 5 個蘋果。

可以看到,CoT 模型把每一步推理都清晰地寫了出來,讓人很容易跟著邏輯走。這種方法有幾個優點:

  1. 提高了模型在複雜推理任務上的準確率,因為每一步都是顯式推理,減少了跳步導致的錯誤。
  2. 讓模型的推理過程變得透明、可解釋,我們可以檢查每一步邏輯是否正確,出錯了也容易排查。
  3. 一定程度上模仿了人類的思維方式。人在解決問題時往往也是一步步思考,而不是直接蹦出答案。
  4. 為進一步研究語言模型的推理能力提供了新思路。透過最佳化 CoT 正規化,可以讓模型掌握更強大的推理技能。

藉助 CoT 推理正規化,我們完全可以讓 AI 的翻譯水平吊打所有的傳統機器翻譯,拳打 Google,腳踢 DeepL

FastGPT 介紹

FastGPT 是一個基於 LLM 大模型的開源 AI 知識庫構建平臺,提供了開箱即用的資料處理、模型呼叫、RAG 檢索、視覺化 AI 工作流編排等能力,幫助您輕鬆構建複雜的 AI 應用。

藉助 FastGPT 的視覺化工作流編排,我們可以充分利用 CoT 推理正規化,將目標拆分成多個步驟,每個步驟都是工作流中的一個節點。

使用 FastGPT 打造最強翻譯

接下來進入正題,使用 FastGPT 的視覺化工作流來打造一個史上最強的 AI 翻譯。

首先需要註冊登入 FastGPT

然後新建一個應用,名字就叫 “拳打 Google 腳踢 Deepl 翻譯大師” 吧。

點選【高階編排】,將【AI 對話】模組的 AI 模型改為 Claude Opus,同時關閉【返回 AI 內容】選項,讓這個模組的 AI 回覆內容不要返回給使用者。因為這個內容還要輸出到下一輪的 AI 對話模組中繼續處理。

提示詞填入以下內容:

你是一個專業的英語翻譯團隊領導,負責安排和協調團隊成員完成高質量的翻譯工作,力求實現"信、達、雅"的翻譯標準。翻譯流程如下:

第一輪翻譯 - 直譯階段:追求忠實原文,將英文逐字逐句地譯成中文,確保譯文準確無誤,不遺漏任何資訊。

第二輪翻譯 - 意譯階段。分開思考和翻譯內容:
【思考】第二輪翻譯需要從多角度思考原文的深層含義,揣摩作者的寫作意圖,在忠實原文的同時,更好地傳達文章的精髓。
【翻譯】在第二輪翻譯中,在直譯的基礎上,深入理解原文的文化背景、語境和言外之意,從整體把握文章的中心思想和情感基調,用地道、符合中文表達習慣的語言進行意譯,力求意境契合,易於理解。注意:只能逐句翻譯原文,不要在末尾加上自己的總結

第三輪翻譯 - 初審校對。分開思考和翻譯內容:
【思考】初審環節的關鍵是要全面審視譯文,確保沒有偏離原意,語言表達準確無誤,邏輯清晰,文章結構完整。
【翻譯】第三輪翻譯要靜心回顧譯文,仔細對比原文,找出偏差和欠缺之處,保證譯文沒有錯漏、歧義和誤解,補充完善相關內容,進一步修改和提升翻譯質量。注意:只能逐句翻譯原文,不要在末尾加上自己的總結

第四輪翻譯 - 終審定稿:作為團隊領導,你要親自把關,綜合各輪次的翻譯成果,取長補短,集思廣益,最終定稿。定稿譯文必須忠實原文、語言流暢、表達準確、通俗易懂,適合目標讀者閱讀。將最終的翻譯內容放在\`\`\`標記的程式碼塊中。

注意:思考部分請用【思考】標註,翻譯結果請用【翻譯】標註。
請嚴格按照以上翻譯步驟和要求,逐段進行翻譯。

點選左上角【+】號,新增一個【AI 對話模組】。

  • 將前面的【AI 對話】模組的輸出端連線到當前【AI 對話】模組的輸入端。
  • 模型選擇 FastAI-4o (就是 gpt-4o)。
  • 使用者問題選擇【AI 對話】-->【AI 回覆內容】。

提示詞填入以下內容:

給定一段多輪翻譯對話,請從中提取出最後一輪翻譯的 Markdown 程式碼塊中的內容。具體要求如下:

1. 仔細閱讀整段對話,找出其中的第四輪翻譯部分
2. 定位第四輪翻譯中的 Markdown 程式碼塊(以 ``` 標識)
3. 提取出程式碼塊中的純文字內容,並將文字中的英文標點符號改為中文標點符號
4. 將修改後的文字內容以純文字的形式輸出,不要包含任何格式和標記。

請嚴格按照以上要求進行提取,確保輸出的內容準確無誤。

大功告成。點選右上角的【除錯】來測試一下:

非常完美。確認沒問題後點選右上角的【釋出】即可。

看看這翻譯質量,是不是吊打所有其他?

由於我們隱藏了第一個節點的 AI 回覆內容,所以會覺得 AI 回覆的非常慢。你可以點選【檢視詳情】,就可以看到第一個節點的 AI 詳細回覆內容了。

如果你忍受不了長時間的等待,可以開啟第一個節點的 AI 回覆,讓 AI 列印出完整的思考過程。或者你也可以將第一個節點的模型改為 FastAI-4o,只不過效果就不如 Claude Opus 了。

沉浸式翻譯網頁

最後放個大招,先給瀏覽器安裝一個沉浸式翻譯擴充套件:https://immersivetranslate.com

這個擴充套件我就不多做介紹了,反正是個神器,很香!大家自己去官網看介紹吧。

安裝完成後,開啟擴充套件的設定介面,在【翻譯服務】裡找到 OpenAI,點選【去修改】。

  • 服務商選擇【自定義 API Key】
  • 模型隨便填,預設即可
  • API 地址為 https://api.fastgpt.in/api/v1/chat/completions
  • System Prompt 啥都不用填,Prompt 只需要填入 {{text}}

  • 至於 APIKEY 填什麼,咱們往下看 👇

在 FastGPT 的 “拳打 Google 腳踢 Deepl 翻譯大師” 應用介面,點選【釋出應用】。

然後選擇【API 訪問】,再點選【新建】即可新建一個 API Key。

將這個 Key 複製貼上到前面的沉浸式翻譯配置中就可以啦!

來看看最終的沉浸式翻譯效果:

完美!

相關文章