定義
即P(感知)—> P(規劃)—>A(行動)。類似人類「做事情」的過程,Agent的核心功能,可以歸納為三個步驟的迴圈:感知(Perception)、規劃(Planning)和行動(Action)。感知(Perception)是指Agent從環境中收集資訊並從中提取相關知識的能力,規劃(Planning)是指Agent為了某一目標而作出的決策過程,行動(Action)是指基於環境和規劃做出的動作。其中,Policy是Agent做出Action的核心決策,而行動又透過觀察(Observation)成為進一步Perception的前提和基礎,形成自主地閉環學習過程。
組成
智慧體正規化
Agent的處理更強調workflow,更像一個flow-engineering
AutoGPT
AutoGPT正規化透過將任務傳送給任務執行智慧體A,將問題與A的結果儲存至記憶,再將A的結果傳送給任務建立智慧體B,將B的結果儲存至記憶,再將記憶傳送給A,如此迭代直至符合條件。
ReWoo
ReWoo將使用者輸入進行計劃拆分後執行,並將所有的結果整合為最後輸出。
ReAct
ReAct自己選擇需要使用的工具,並使用工具獲取輸出。