一文搞懂 AI Agents 的不同型別

danny_2018發表於2023-12-05

【摘要】本文將聚焦在針對不同型別的 AI Agents 技術進行解析,使得大家能夠了解不同 AI Agents 實現機制以及所應用的市場領域。

【作者】李傑,專注於Java虛擬機器技術、雲原生技術領域的探索與研究。

5 種不同型別的 AI Agents

通常而言,AI Agents 可以根據其智慧水平和能力進行分類劃分。根據 Russell & Norvig 的所述,AI Agents 主要分為五種型別,每種型別具有其獨特的特點和應用場景。

每種型別的 AI Agents 都有其優點和侷限性,使其適用於不同的應用程式和環境。這裡,我們針對每種型別進行更詳細的探索以便進一步深入瞭解它們的功能、優勢和應用程式的適用性。根據具體的問題和需求,選擇合適的 AI Agents 型別可以提高系統的效能和效果。

Simple Reflex Agents - 簡單反射代理

基於上述模型圖可以看到:AI 中的這些型別的代理,例如簡單的反射代理和基於模型的反射代理,透過感知環境的當前狀態來採取行動。它們的行動並不基於任何既定模型或先前的資訊,而是依賴於對環境的充分觀察。這些代理遵循條件行動規則,也就是說, 往往 根據感知到的條件來決定採取對應的行動。

打個比方,假設我們開車的過程中,看到路上有行人橫穿馬路時,潛意識地果斷採取剎車措施以避免交通事故。像這種會根據事先設定的規則,不需要建立複雜的模型或依賴先前的資訊,而是根據當前的感知情況來做出決策。

這種 Reflex Agents 的 成功取決於對環境的充分觀察。如果代理能準確感知到行人危險操作的存在,它將能夠及時採取行動並避免車禍發生。然而,如果代理對環境的感知不準確或遺漏了一些重要資訊,它可能無法做出適當的決策。

因此,這些反射代理型別在行動選擇上依賴於當前的感知和條件規則,而不需要事先建立模型或依賴先前的資訊。這種設計模式使得它們能夠快速做出反應,適用於一些簡單的、實時性強的任務和環境。然而,對於更復雜的問題和環境,可能需要更高階的代理型別,如基於目標的代理、基於實用程式的代理或學習代理,以便進行更深入的推理和決策。

通常而言, Simple Reflex Agents 設 計方法存在一些問題,這些問題限制了它們的智慧水平和適應性,具體涉及如下幾個方面:

1、有限的智慧

Simple Reflex Agen 是基於固定的條件-動作規則構建,因此,它們的智慧行為受限於事先定義好的規則。由於缺乏複雜的推理和學習能力,導致 Simple Reflex Agen 無法進行靈活的決策和問題解決。

2、受限的感知能力

除了上述的智慧因素外, Simple Reflex Agen 也 需要充分的可觀察性,即只能根據當前環境狀態的可感知部分來採取行動。它們無法處理環境中不可感知的資訊,這可能導致決策的侷限性。代理無法考慮到隱藏或間接的因素,從而可能做出不完全準確或不理想的決策。

3、缺乏環境適應性

由於基於固定的條件-動作規則的有限智慧, Simple Reflex Agents 無法適應環境的變化。當環境發生變化時,便無法自動調整或學習新的行為模式,從而導致可能無法有效地應對新的情況。

Model-Based Reflex Agents - 基於模型的反射代理

其實,從本質上來講,相比於 Simple Reflex Agents,Model-Based Reflex Agents 採用更多基於模型的代理和內部狀態來做出決策,即使在部分可觀察的環境中也能做到如此。這種代理型別不僅根據當前感知的情況,還會追蹤其感知歷史,並利用這些資訊來指導行動選擇。

一個典型的基於模型的反射代理的例子是亞馬遜的 Bedrock 系統。Bedrock 利用模型、見解和預測結果來做出決策。透過使用真實資料來完善模型,並提前規劃各種可能性,Bedrock 能夠有效地管理複雜任務並適應環境的變化。

Bedrock 系統的關鍵在於其能夠建立環境模型,並利用該模型進行推理和預測。這使得代理能夠對環境中不可觀察或部分觀察的因素做出推斷,並做出相應的決策。此外,Bedrock 系統還能夠根據先前的感知歷史來調整行動選擇,從而提高決策的質量和適應性。

Model-Based Reflex Agents 充分利用了代理內部狀態和建模能力,使其在面對複雜任務和動態環境時能夠更加靈活、智慧地做出決策。這種代理設計方法透過整合感知、模型和推理,提供了更高階的智慧和適應性,為解決複雜問題提供了一種有效的方法。

基於 Model-Based Reflex Agents 在決策過程中涉及兩個基本因素,即模型和內部狀態。這兩個因素對於代理的智慧和適應性至關重要。

1、模型:Model-Based Reflex Agents 透過尋找與當前情況相匹配的條件規則來工作。這個模型具有內建的歷史記錄和關於環境的資訊。在 AI 中,這種代理可以根據模型使用多種與條件相關的動作。模型允許代理在部分可觀察的環境中進行行動選擇和決策,可以利用先前的感知和經驗來推斷未觀察到的環境因素,並根據這些推斷做出決策。

2、內部狀態:代理必須瞭解自身的內部狀態,這個狀態是由當前和過去的感知所註冊和記錄的。當前狀態儲存在代理內部,它是一種典型的結構,用於描述環境中不可見部分。為了更新內部狀態,代理必須瞭解環境是如何自發演化的(不論智慧體如何行動),以及智慧體的行為將如何影響環境。透過對內部狀態的維護和追蹤,代理能夠對環境的動態變化做出反應,並相應地調整其決策。

Goal-Based Agents - 基於目標的代理

Goal-Based Agents 是一種高度適應性強的實體,利用知識和搜尋演算法來選擇能夠最佳實現其目標的選項。此種代理設計方法通常應用於機器人、計算機視覺和自然語言處理等領域。

Goal-Based Agents 依賴於知情的搜尋演算法和規劃,以有效地執行任務。這些代理透過對可能的行動序列進行搜尋,並利用啟發式方法和領域專家知識來指導搜尋過程,以找到最優的解決方案。

通常而言,Goal-Based Agents 具有靈活性的優勢,因為可以輕鬆地修改代理程式中的知識和演算法,以適應新的情況和目標。這意味著當環境發生變化或者任務要求發生改變時,代理可以透過更新其知識庫和調整搜尋演算法來適應新的要求。這種靈活性使得基於目標的代理能夠適應複雜和動態的環境,並具備處理各種任務的能力。

此外,基於目標的代理是一種高階的代理設計方法,結合了知識表示、搜尋演算法和規劃技術,以實現智慧決策和問題解決。透過利用知識和搜尋能力,這種代理能夠在不同領域和應用中表現出色,並具備適應新情況和目標的能力。

Utility-based agents -基於效用的代理

Utility-Based Agents 是一種根據其目標做出決策並評估多個場景以最大化預期效用函式的代理方法。此種代理設計方法往往涉及以下關鍵點:

1、為不同的狀態分配數值:Utility-Based Agents 會為不同的狀態分配數值,這些數值代表了該狀態下的成功或幸福程度。透過對狀態賦予數值,代理能夠對不同狀態的優劣進行比較,並基於這些數值評估決策的效果。

2、比較每個狀態下不同行動的結果:Utility-Based Agents 會比較在每個狀態下采取不同行動的結果,並將這些結果與預期效用函式進行比較。透過評估不同行動的結果,代理能夠選擇那些能夠最大化預期效用的行動。

3、根據效用價值做出決策:Utility-Based Agents 會根據效用價值來做出決策。效用價值是基於代理對不同狀態的評估和對行動結果的比較所得出的價值。代理會選擇那些具有最高效用價值的行動,以實現其目標並最大化預期效用。

從某種意義上來說,Utility-Based Agents 可以被認為是一種理性智慧體,特別在面對複雜和不確定的情況下具有重要作用。這種代理能夠考慮多種因素和潛在結果,並透過比較效用價值來做出最優決策。透過權衡不同的選擇並選擇那些能夠最大化預期效用的行動,Utility-Based Agents 能夠在面對挑戰和不確定性的環境中表現出卓越的決策能力。

Learning Agents - 學習代理

Learning Agents 是 AI 領域中的關鍵元件,能夠利用當前和以前的經驗,避免不必要的行為,並學習新的選項以提高效能。此種型別代理能夠將感知能力整合到早期未見的環境觀察中,並將其儲存為內部狀態,從而為未來的決策和行動提供有用的資訊。因此,Learning Agents 不僅僅是執行任務,還包括研究和規劃。

打個比方,自動駕駛是一個典型的基於高階代理的應用,可以透過利用內部狀態和學習來避開交通擁堵路線,或自動調整車速和車內溫度等控制引數。透過感知環境的變化並將其納入內部狀態,自動駕駛可以做出智慧的決策,以提供更高效、安全和舒適的駕乘體驗。

Learning Agents 這種高階代理的優勢在於能夠不斷學習和適應新的情況和選項,以改進其效能。透過整合感知、學習和規劃能力,這些代理能夠在複雜和動態的環境中做出智慧決策,並根據實時情況進行調整,從而使得它們能夠應對各種挑戰,並在未知環境中展現出強大的適應性和效能提升能力。

通常而言,Learning Agents 由以下四個主要元件組成,這些元件共同促進了整體學習過程:

1、Learning Element-學習元素:

Learning Element 是學習代理的核心組成部分,利用來自評論家的反饋資訊來幫助自身學習,並觀察自身的表現並與預設的效能標準進行比較。學習元素負責協調代理的各個元件,以實現學習和提高效能的目標。

2、Critic-評論家:

Critic 向學習元素提供有關代理行為對於預設標準的反饋資訊,評估執行元素所採取的行動及其有效性,並向學習元素提供適當的指導。評論家的反饋幫助學習元素調整其內部狀態,以改進表現。

3、Performance Element-執行元素:

執行元素採取實際的外部行動,透過與環境進行互動來產生影響。學習元素可以根據來自評論家的反饋要求修改執行元素的行動。因此,執行元素在設計和修改學習元素時起著關鍵作用。

4、Problem Generator-問題生成器:

Problem Generator 實際上不是生成問題,而是為智慧體提供從外部環境中獲取更多資訊的新情境。它向學習元素公開,為其提供更有用的指導,幫助其更好地學習和適應環境。

這些元件共同作用,使得 Learning Agents 能夠不斷改進自身的行為和效能。學習元素透過與評論家的互動獲取反饋資訊,並透過修改執行元素的行動來實現學習。問題生成器提供新的情境和指導,促進學習元素的發展。整體而言,這些元件協同工作,使得學習代理能夠逐步提高效能並適應不斷變化的環境。

AI Agents 有哪些優勢及面臨的挑戰?

在實際的業務場景中,AI Agents 能夠在各種不同的領域中提供高效、自動化、決策和問題解決的能力,具體如下:

1、流程自動化:AI Ag ents 可以自動執行以前需要手動完成的任務,從而簡化和加速工作流程,提高效率。

2、任務優先順序確定:透過機器學習演算法, AI Ag ents 可以分析和評估任務,確定其優先順序,使得工作可以更有組織性和高效性。

3、自然語言處理:AI Ag ents 利用自然語言處理技術,能夠理解和解釋使用者的意圖和需求,從而更好地與人進行互動和溝通。

4、減少人為錯誤:AI Ag ents 可以透過自動化和智慧決策減少人為錯誤的發生,提高工作的準確性和可靠性。

5、資料處理能力:AI Ag ents 可以輕鬆處理大量資料,並從中提取有用的資訊和洞察,以支援決策制定和問題解決。

儘管 AI Agents 具有眾多優勢,但同時也帶來了一系列值得關注的挑戰。一些主要問題包括道德考慮、資料隱私問題和潛在的濫用。具體如下:

1、 道德考慮:A I Agents 在做出決策和執行任務時,可能面臨道德困境。例如,在自動駕駛汽車中,當發生不可避免的事故時, AI Agents 需要做出選擇,這引發了道德優先順序和生命價值的問題。

2、資料隱私問題:A I Agents 需要大量資料來進行學習和推斷,這可能涉及個人隱私的問題。收集、儲存和處理大量個人資料可能導致隱私洩露和濫用的風險,需要制定合適的隱私保護措施和法規。

3、潛在的濫用:A I Agents 的潛在濫用是一個重要的問題。例如,人工智慧可以被用於製造假新聞、進行網路欺詐或進行個人監控。防止人工智慧技術被惡意利用需要加強監管、教育和技術安全措施。

除了上述的核心問題之外,所面臨的其他挑戰包括安全風險、法規、任務複雜度、資料可用性和質量、定義成功標準以及其他層面等等。

如何更好地提高 AI Agents 效能?

為了提高 AI Agents 的效能,可以採用多種技術和策略,其中包括機器學習、搜尋演算法和最佳化等。這些技術在增強各個領域的 AI Agents 效能方面具有廣泛的應用,並且不斷髮展和演進。

1、機器學習技術

AI A gents 透過學習過去的經驗、適應新情況並接收反饋,可以持續改進並提高其效能。為此,使用各種流行的機器學習技術是至關重要的。這些技術包括監督學習、無監督學習、迴歸、分類、聚類和異常檢測等。

透過採用這些機器學習技術,AI Agents 可以完善其決策和解決問題的能力,確保在各種應用中表現得更加準確和高效。這些技術使代理能夠從大量的資料中學習,提取特徵和模式,並將其應用於新的情況中。透過學習和適應,代理可以不斷改進自身的效能,並更好地適應不斷變化的環境和需求。

2、搜尋演算法和最佳化

AI Agents 使用各種搜尋演算法和最佳化技術來解決問題。這些演算法包括 Uninformed search、Informed search、Hill climbing 以及 Means-end analysis 等。

這些搜尋演算法和最佳化技術幫助 AI Agents 在複雜的問題空間中導航,並針對不同情況找到最有效的解決方案。Uninformed search 和 Informed search 演算法可以幫助代理系統地探索問題空間,並找到最佳的解決路徑。Hill climbing 演算法則適用於在解空間中尋找區域性最優解的最佳化問題。而Means-end analysis 則是一種透過分析目標與當前狀態之間的差異來制定解決方案的方法。

以上為 AI Agents 不同型別技術的解析,更多關於 AI Agents 的內容可參考後續文章所述,謝謝!


來自 “ twt企業IT社群 ”, 原文作者:Luga Lee;原文連結:https://mp.weixin.qq.com/s/_9bsyrif543sD4NSM7ZovQ,如有侵權,請聯絡管理員刪除。