到底選誰?五大多智慧體 ( Multi-AI Agent) 框架對比

Baihai_IDP發表於2024-12-02

編者按: 當前 AI 技術發展日新月異,多智慧體框架如雨後春筍般湧現。如何在 AutoGen、LangGraph、CrewAI 等眾多框架中做出正確選擇,找出那一個真正適合你需求的多智慧體框架?

本文作者透過對五大多智慧體 AI 框架的比較,提出了一個關鍵觀點:不同的 AI 框架適用於不同的場景和需求,選擇的關鍵在於精準匹配專案特點和技術路線。

作者 | Mehul Gupta

編譯 | 嶽揚

在生成式 AI 領域,Multi-AI Agent 這一話題正變得日益火熱。眾多科技巨頭紛紛推出了相關框架,令人目不暇接。

但是,面對眾多的 Multi-AI Agent 框架,如何做出選擇確實是個難題。

市場上的選項繁多,讓人難以決斷!

特別是在 OpenAI 推出了 Swarm,微軟也推出了 Magentic-One 之後,這一領域更是顯得擁擠。為了幫助大家理清思路,我將詳細剖析這些框架的核心特性、優勢以及潛在的不足,以便大家能根據自己的需求做出最佳選擇。接下來,我們將逐一探討這些框架:

AutoGen (Microsoft)

LangGraph (LangChain)

CrewAI

OpenAI Swarm (OpenAI)

Magentic-One (Microsoft)

01 Autogen

AutoGen 框架是該領域的先驅,由微軟推出,並在軟體開發領域得到了廣泛應用。

主要特點如下:

  • AutoGen 包含使用者智慧體和助手智慧體兩個核心角色。
  • 使用者智慧體負責提出程式設計需求或編寫提示詞,助手智慧體則負責生成和執行程式碼。
  • 助手智慧體不僅負責程式碼生成,還包括程式碼執行過程,並將結果反饋給使用者智慧體或其他智慧體。
  • 該框架擅長於程式碼任務的多智慧體編排(multi-agent orchestration),同時也具備處理其他型別任務的能力。
  • 在智慧體間的互動過程中,允許人工提供指導。
  • 來自微軟的強大、堅實的社群支援。

然而,AutoGen 也存在以下侷限性:

  • 對非程式設計背景的使用者來說,操作不夠直觀。
  • 在本地部署大語言模型(LLMs)時,配置過程較為繁瑣,需要額外配置代理伺服器。
  • 在非軟體開發領域,其表現可能不如專業工具出色。

02 CrewAI

CrewAI 通常是大家快速搭建 Multi-AI Agent 任務演示的首選工具,因為它的操作直觀,配置起來也十分簡便。

功能特點:

  • 操作介面直觀,主要依靠編寫提示詞。
  • 建立新智慧體並將其融入系統非常簡單,幾分鐘內就能生成上百個智慧體。
  • 即便是非技術背景的使用者也能輕鬆上手。
  • 得益於與 LangChain 的整合,它能夠與多數 LLM 服務提供商和本地 LLM 配合使用。

不足之處:

  • 在靈活性和定製化方面有所限制。
  • 更適合處理基礎場景,對於複雜的程式設計任務則不太理想。
  • 智慧體間的互動偶爾會出現一些故障。
  • 技術社群的支援力度相對較弱。

03 Langraph

我個人非常推崇 LangGraph,這個工具可以適用於各種 Multi-AI Agent 任務,並且具有極高的靈活性。

功能特點:

  • LangGraph 基於 LangChain 開發,其核心思想是“有向迴圈圖(Directed Cyclic Graph)”。
  • 它不僅僅是一個 Multi-AI agent 框架,功能遠超於此。
  • 高度靈活,可定製性強,幾乎能夠滿足所有多智慧體協作應用的需求。
  • 作為 LangChain 的延伸,它得到了技術社群的大力支援。
  • 能夠與開源的 LLMs(大語言模型)以及各種 API 無縫協作。

不足之處:

  • 文件資料不夠詳盡。對於程式設計經驗較少的使用者來說,上手難度較大。
  • 使用它需要具備一定的程式設計能力,特別是在圖(graphs)和邏輯流程的理解上。

04 OpenAI Swarm

OpenAI 最近釋出了 Swarm,我得說,對於想要入門 Multi-AI agent 框架的新手來說,這可能是目前最易用的選擇。

功能特點:

  • 非常適合 Multi-AI Agent 領域的新手。
  • 主要致力於簡化“智慧體建立”過程,以及智慧體之間的上下文切換操作(我們稱之為Handoffs)。
  • 製作一個簡短的演示應用極其簡單。

不足之處:

  • 只支援 OpenAI API,不支援其他 LLMs。
  • 不適合在生產環境部署。
  • 系統的靈活性有待提高。
  • 技術社群支援較弱,甚至無法在 GitHub 上提交問題反饋。

05 Magentic-One

最新亮相的是微軟推出的 Magnetic-One(這是微軟的第二個框架),其目標是對現有的 AutoGen 框架進行簡化。

功能特點:

  • 與 Swarm 相似,Magnetic-One 同樣適用於程式設計經驗較少的使用者,操作起來簡便快捷。
  • 系統預設了五個智慧體,包括一個管理智慧體和另外四個專用智慧體:WebSurfer 負責在瀏覽器中瀏覽網頁以及與網頁進行互動,FileSurfer 負責本地檔案的管理與導航,Coder 專注於程式碼的編寫與分析,而 ComputerTerminal 則提供控制檯訪問許可權,執行程式和安裝庫檔案。
  • 該框架基於 AutoGen 打造,是一個通用框架。
  • 附帶了 AutoGenBench 工具,專門用於評估智慧體的效能。

不足之處:

  • 對開源 LLMs 的支援較為複雜,不易實現。
  • 靈活性有待提高;從某種程度上看,它更像是一款應用,而非一個框架。
  • 目前的文件資料和技術社群支援力度幾乎為零,尚需加強。

06 那麼,哪一款 Multi-AI Agent 框架最為出色?

以下是我的個人見解(我親身體驗過這些智慧體框架):

  • 在軟體開發方面:AutoGen(由微軟推出) —— 它最適合處理程式碼生成和複雜的 multi-agent 編碼工作流任務。
  • 對於初學者來說:OpenAI Swarm 和 CrewAI —— 這兩個框架操作簡便,非常適合剛接觸 multi-agent AI 且沒有複雜配置需求的新手使用。
  • 處理複雜任務的首選:LangGraph —— 該框架提供了極高的靈活性,是為高階使用者設計的,支援自定義邏輯和智慧體編排(orchestration)。
  • 在與開源 LLMs 的相容程度方面:LangGraph —— 它與開源 LLMs 的相容性極佳,支援多種 API 介面,這是其他一些框架所不具備的。CrewAI 在這方面也表現不俗。
  • 技術社群支援最給力:AutoGen 擁有相當不錯的技術社群支援,能夠幫助使用者解決一些難題。
  • 即開即用的選擇:CrewAI —— 它的配置快捷、操作直觀,非常適合用於演示或是需要迅速建立智慧體的任務。Swarm 和 Magentic-One 的表現也相當不錯,但社群支援相對較弱。
  • 價效比之王:Magentic-One —— 它提供了一套預配置的解決方案,採用了通用框架的設計方法,可能在初期能夠節省成本。Swarm 和 CrewAI 在成本效益方面也值得關注。

Thanks for reading!

Hope you have enjoyed and learned new things from this blog!

About the authors

Mehul Gupta

GenAI Courses & Projects : 

https://datasciencepocket.gumroad.com/

END

本期互動內容 🍻

❓你認為哪個框架最適合你的需求?為什麼?

原文連結:

https://medium.com/data-science-in-your-pocket/magentic-one-a...

相關文章