AI時代你一定要知道的Agent概念

程序员半支烟發表於2024-07-18

這兩年,隨著人工智慧(AI)和計算能力的發展,AI應用的落地速度大大加快。以ChatGPT為代表的AI應用迅速火遍全球,成為打工人的常用工具。緊接著,多模態、AI Agent等各種高大尚的名詞也逐漸進入大眾視野,吸引了大量關注。那麼,到底什麼是AI Agent?下文半支菸將帶你詳細瞭解這個概念。

1. 一句話總結:什麼是AI Agent

AI Agent,經常被翻譯為:智慧體或代理。

一句話總結,AI Agent就是一個有著聰明大腦而且能夠感知外部環境採取行動智慧系統

我們可以把它想象成一個能思考和行動的人,而大型語言模型(LLM)就是這個人的“大腦”。透過這個大腦,再加上一些能夠感知外部世界和執行任務的部件,AI Agent就變成了一個有“智慧”的機器人。

要讓AI Agent充分利用它的“大腦”和各種元件,需要一種協調機制。ReAct機制就是常用的協調機制。透過ReAct機制,AI Agent能夠結合外部環境和行動元件,完成複雜的任務。

為什麼我們需要AI Agent呢?其實說到底是因為單一的模型對我們來說作用不大,我們需要的是一個具備智慧的複雜系統。只有複雜系統才能真正的應到到實際生產工作中。

2. 從單一模型到複合AI系統

要理解AI Agent,我們先看看AI領域的一些變化。

以前的AI系統通常是單一模型,受訓練資料的限制,只能解決有限的任務或者固定領域的任務,難以適應新的情況。

而現在,我們有了LLM通用大模型,訓練的資料更多,能完成更多領域的任務,比如內容生成、文生圖、文生影片等等。同時還可以把大模型和各種外部元件結合起來,構建複合AI系統,這樣就能解決更復雜的問題。

舉個例子,如果直接讓單一模型幫我制定一個去三亞的旅遊計劃,它無法做到。如果讓LLM大模型幫我制定一個去三亞的旅遊計劃,它可以制定一個雞肋的計劃,幾乎不可用,因為它不知道我的個人資訊、也不知道航班資訊,也不知道天氣情況。

但如果我們設計一個複雜AI系統,讓系統裡的LLM大模型能夠透過工具能訪問我的個人資訊,訪問網際網路上的天氣情況,訪問航班資訊,再結合航班系統的開放介面,就可以自動幫我預定機票,自動制定行程規劃了。

這就是複合AI系統的魅力,它能夠結合工具、記憶、其餘各種元件 來解決複雜問題。

3. 複合AI系統的模組化

複合AI系統是模組化的,就像拼積木一樣。你可以選擇不同的模型和元件,然後把它們組合在一起,解決不同的問題。

比如,你可以用一個模型來生成文字,用另一個模型來處理影像,還可以用一些編寫的程式程式碼,一起構建出複雜AI系統。

4. AI Agent的推理與行動能力

AI Agent的核心是讓LLM大模型 掌控 複雜AI系統的邏輯,說白了就是讓LLM主導AI Agent的思維過程。我們向LLM輸入複雜問題,它可以將複雜問題分解並一步步的制定解決方案。

這與設計一個程式系統不同,在AI系統裡,LLM大模型會一步一步的思考、制定一步一步的計劃,然後一個一個的去解決。並不是按照某個指定程式去執行的。

AI Agent的元件包括:大模型的推理能力、行動能力 和 記憶能力。

  • 大模型的推理能力是 解決問題的核心。
  • 行動能力透過工具(外部程式)實現,模型可以定義何時呼叫它們以及如何呼叫它們。工具可以是搜尋引擎、計算器、運算元據庫等。
  • 記憶能力使大模型能夠儲存內部日誌和對話歷史,從而使體驗更加個性化。記憶可以幫助大模型在解決複雜問題時保持上下文連貫。

5. 總結

我們正處於AI Agent發展的早期階段。未來,我們將看到更多的系統利用AI Agent進行"AI+"的轉型。

總結來說,AI Agent透過整合LLM的推理能力和外部工具的行動能力,能夠在複雜環境中自主解決問題。ReAct機制很好的實現了AI Agent的理念。

希望這篇部落格對你有幫助!如果你有問題或想法,歡迎在評論區留言,一起探討!

如果想了解具體的程式碼實踐,可以翻閱我的這篇文章《基於ReAct機制的AI Agent》。

=====>>>>>> 關於我 <<<<<<=====

本篇完結!歡迎點贊 關注 收藏!!!

原文連結:https://mp.weixin.qq.com/s/E3odBUtAGY9bzGIxOFt1HA

相關文章