Claude都能操縱計算機了，吳恩達：智慧體工作流越來越成熟

机器之心發表於2024-11-15

原文網址 : https://www.jiqizhixin.com/articles/2024-11-15-6

受 ChatGPT 強大問答能力的影響，大型語言模型（LLM）提供商往往最佳化模型來回答人們的問題，以提供良好的消費者體驗。

隨著智慧體研究日趨成熟，最佳化似乎有了新的方向。

人工智慧著名學者、史丹佛大學教授吳恩達今天指出：「現在有一種趨勢是最佳化模型以適應智慧體工作流程，這將為智慧體效能帶來巨大提升」，並撰寫一篇部落格簡單闡述了這種趨勢。

我們對部落格內容進行了不改變原意的編譯、整理，以下是部落格內容：

繼 ChatGPT 在回答問題方面取得突破性成功之後，許多 LLM 的開發都集中在提供良好的消費者體驗上。因此，LLM 被調整為回答問題或遵循人類提供的指令。指令調整指導模型的資料集很大一部分可以為人類編寫的問題和指令提供更有用的答案，面向 ChatGPT、Claude、Gemini 等等。

但智慧體工作負載不同，人工智慧軟體不是直接為消費者生成響應，而是應該在迭代工作流程中：

反思自己的輸出；
使用工具；
編寫規劃；
在多智慧體環境中進行協作。

主要模型製造商也越來越多地最佳化用於 AI 智慧體的模型。

以工具使用（或函式呼叫）為例。如果 LLM 被問及當前天氣，它將無法從訓練資料中獲取所需的資訊。相反，它可能會生成 API 呼叫請求以獲取該資訊。甚至在 GPT-4 原生支援函式呼叫之前，應用程式開發人員就已經使用 LLM 來生成函式呼叫，透過編寫更復雜的提示來告訴 LLM 哪些函式可用，然後讓 LLM 生成用於確定是否要呼叫函式的字串。

在 GPT-4 之後，生成此類呼叫變得更加可靠，然後許多其他模型本身就支援函式呼叫。如今，LLM 可以決定呼叫函式來搜尋資訊以進行檢索增強生成 (RAG)、執行程式碼、傳送電子郵件、線上下訂單等等。

最近，Anthropic 推出了升級版的 Claude 3.5 Sonnet，能像人一樣使用計算機。這意味著 LLM 原生使用計算機方向向前邁出了一大步，將幫助許多開發人員。一些團隊還致力於讓 LLM 使用計算機構建新一代 RPA（機器人流程自動化）應用程式。

隨著智慧體工作流程的成熟，我看到的是：

首先，許多開發人員正在 prompt LLM 來執行他們想要的智慧體行為。這樣可以進行快速、豐富的探索！
在極少數情況下，開發非常有價值的應用程式的開發人員將微調 LLM，以更可靠地執行特定的智慧體功能。例如，儘管許多 LLM 本身支援函式呼叫，但它們是透過將可用函式的描述作為輸入，然後（希望）生成輸出 token 以請求正確的函式呼叫來實現這一點的。對於生成正確函式呼叫非常重要的任務關鍵型應用程式，針對應用程式的特定函式呼叫微調模型可顯著提高可靠性。（但請避免過早最佳化！我仍然看到太多團隊在進行微調，而他們可能應該在採取這種做法之前花更多時間進行 prompt。）
最後，當諸如工具使用或計算機使用之類的能力對開發人員來說似乎很有價值時，主要的 LLM 提供商正在將這些能力直接構建到他們的模型中。儘管 OpenAI o1-preview 的高階推理對消費者有幫助，但我預計它對於智慧體推理和規劃會更有用。

大多數 LLM 都針對回答問題進行了最佳化，主要是為了提供良好的消費者體驗，我們已經能夠將它們「移植」到複雜的智慧體工作流程中，以構建有價值的應用程式。為支援智慧體中的特定操作而構建 LLM 的趨勢將為智慧體效能帶來很大提升。我相信，在未來幾年內，在這個方向上將實現巨大的智慧體能力提升。

^{原文連結：}

^{https://www.deeplearning.ai/the-batch/issue-275/}

photoshop2022破解版出來了，p圖越來越智慧，使用越來越簡單
2022-01-27
Voodoo越來越不“超休閒”了
2020-09-09
Odoo
商人在Steam上賺錢越來越難了
2020-03-06
疫情後——養生越來越被重視了
2023-03-01
兩輪電動車越來越擁擠了
2022-05-25
當軟體更改的成本代價越來越低，你的產品就會越來越強！！！
2019-02-01
改變傳統，吳恩達開源了一個機器翻譯智慧體專案
2024-06-13
吳恩達智慧體
【日記】感覺自己越來越擺了（546 字）
2024-08-08
元宇宙和NFT，玩家越來越不想懂你們了
2022-02-10
元宇宙
Horowitz Research：隨著Z世代觀眾的成熟，電視變得越來越重要
2023-01-16
TypeScript 正在越來越重要
2024-07-04
TypeScript
C# 中的 is 真的是越來越強大，越來越語義化
2020-09-30
C#
百萬tokens低至1元！大模型越來越捲了
2024-05-13
大模型
大模型代肝，自動刷《崩鐵》升級材料，Claude操縱計算機還能這麼用！
2024-11-20
大模型計算機
為什麼實體發展越來越難了？因為你忽視了智慧數字經營的重要性
2021-11-26
2024吳恩達機器學習
2024-08-27
吳恩達機器學習
越來越討厭爬蟲
2020-01-11
爬蟲
你是如何離程式設計越來越遠的？
2020-04-04
程式設計
遊戲公司做影視：我們越來越認真了
2020-02-25
遊戲
程式設計師越來越多，為啥工資反而越來越高？
2019-12-26
程式設計師
為何我們使用的手機會越來越貴
2018-08-08
javaScript正變得越來越流行
2020-12-28
JavaScript
創造一個大型遊戲世界越來越難了嗎？未必
2020-08-04
遊戲
想在遊戲裡不打出敏感詞，已經越來越難了
2021-04-12
遊戲
短壽魔咒下，數值卡牌遊戲越來越難了
2021-03-04
遊戲
比亞迪越來越像華為？
2022-06-30
十多年了，介面自動化測試越來越雞肋？
2024-04-08
人工智慧的影響正變得越來越難以預測
2018-07-05
人工智慧
CMU把具身智慧的機器人給越獄了
2024-12-19
機器人
為什麼軟體測試行業越來越受歡迎？
2022-01-12
行業
小米手機外觀越來越不好看普遍缺乏創新？
2018-05-07
吳恩達機器學習筆記（3）
2019-01-21
吳恩達機器學習筆記
吳恩達機器學習提交問題
2020-11-02
吳恩達機器學習
如何走出情緒越來越壞的怪圈？
2019-07-11
為什麼前端工作越來越難找了?
2019-03-30
前端
大資料分析為啥越來越重要
2021-12-09
大資料
為什麼女性內衣越來越貴？
2022-05-18
皮尤研究中心：調查顯示美國低收入人群越來越依賴智慧手機
2019-06-18

Claude都能操縱計算機了，吳恩達：智慧體工作流越來越成熟

相關文章