編者按: 當前 AI 技術發展日新月異,多智慧體框架如雨後春筍般湧現。如何在 AutoGen、LangGraph、CrewAI 等眾多框架中做出正確選擇,找出那一個真正適合你需求的多智慧體框架?
本文作者透過對五大多智慧體 AI 框架的比較,提出了一個關鍵觀點:不同的 AI 框架適用於不同的場景和需求,選擇的關鍵在於精準匹配專案特點和技術路線。
作者 | Mehul Gupta
編譯 | 嶽揚
在生成式 AI 領域,Multi-AI Agent 這一話題正變得日益火熱。眾多科技巨頭紛紛推出了相關框架,令人目不暇接。
但是,面對眾多的 Multi-AI Agent 框架,如何做出選擇確實是個難題。
市場上的選項繁多,讓人難以決斷!
特別是在 OpenAI 推出了 Swarm,微軟也推出了 Magentic-One 之後,這一領域更是顯得擁擠。為了幫助大家理清思路,我將詳細剖析這些框架的核心特性、優勢以及潛在的不足,以便大家能根據自己的需求做出最佳選擇。接下來,我們將逐一探討這些框架:
AutoGen (Microsoft)
LangGraph (LangChain)
CrewAI
OpenAI Swarm (OpenAI)
Magentic-One (Microsoft)
01 Autogen
AutoGen 框架是該領域的先驅,由微軟推出,並在軟體開發領域得到了廣泛應用。
主要特點如下:
- AutoGen 包含使用者智慧體和助手智慧體兩個核心角色。
- 使用者智慧體負責提出程式設計需求或編寫提示詞,助手智慧體則負責生成和執行程式碼。
- 助手智慧體不僅負責程式碼生成,還包括程式碼執行過程,並將結果反饋給使用者智慧體或其他智慧體。
- 該框架擅長於程式碼任務的多智慧體編排(multi-agent orchestration),同時也具備處理其他型別任務的能力。
- 在智慧體間的互動過程中,允許人工提供指導。
- 來自微軟的強大、堅實的社群支援。
然而,AutoGen 也存在以下侷限性:
- 對非程式設計背景的使用者來說,操作不夠直觀。
- 在本地部署大語言模型(LLMs)時,配置過程較為繁瑣,需要額外配置代理伺服器。
- 在非軟體開發領域,其表現可能不如專業工具出色。
02 CrewAI
CrewAI 通常是大家快速搭建 Multi-AI Agent 任務演示的首選工具,因為它的操作直觀,配置起來也十分簡便。
功能特點:
- 操作介面直觀,主要依靠編寫提示詞。
- 建立新智慧體並將其融入系統非常簡單,幾分鐘內就能生成上百個智慧體。
- 即便是非技術背景的使用者也能輕鬆上手。
- 得益於與 LangChain 的整合,它能夠與多數 LLM 服務提供商和本地 LLM 配合使用。
不足之處:
- 在靈活性和定製化方面有所限制。
- 更適合處理基礎場景,對於複雜的程式設計任務則不太理想。
- 智慧體間的互動偶爾會出現一些故障。
- 技術社群的支援力度相對較弱。
03 Langraph
我個人非常推崇 LangGraph,這個工具可以適用於各種 Multi-AI Agent 任務,並且具有極高的靈活性。
功能特點:
- LangGraph 基於 LangChain 開發,其核心思想是“有向迴圈圖(Directed Cyclic Graph)”。
- 它不僅僅是一個 Multi-AI agent 框架,功能遠超於此。
- 高度靈活,可定製性強,幾乎能夠滿足所有多智慧體協作應用的需求。
- 作為 LangChain 的延伸,它得到了技術社群的大力支援。
- 能夠與開源的 LLMs(大語言模型)以及各種 API 無縫協作。
不足之處:
- 文件資料不夠詳盡。對於程式設計經驗較少的使用者來說,上手難度較大。
- 使用它需要具備一定的程式設計能力,特別是在圖(graphs)和邏輯流程的理解上。
04 OpenAI Swarm
OpenAI 最近釋出了 Swarm,我得說,對於想要入門 Multi-AI agent 框架的新手來說,這可能是目前最易用的選擇。
功能特點:
- 非常適合 Multi-AI Agent 領域的新手。
- 主要致力於簡化“智慧體建立”過程,以及智慧體之間的上下文切換操作(我們稱之為Handoffs)。
- 製作一個簡短的演示應用極其簡單。
不足之處:
- 只支援 OpenAI API,不支援其他 LLMs。
- 不適合在生產環境部署。
- 系統的靈活性有待提高。
- 技術社群支援較弱,甚至無法在 GitHub 上提交問題反饋。
05 Magentic-One
最新亮相的是微軟推出的 Magnetic-One(這是微軟的第二個框架),其目標是對現有的 AutoGen 框架進行簡化。
功能特點:
- 與 Swarm 相似,Magnetic-One 同樣適用於程式設計經驗較少的使用者,操作起來簡便快捷。
- 系統預設了五個智慧體,包括一個管理智慧體和另外四個專用智慧體:WebSurfer 負責在瀏覽器中瀏覽網頁以及與網頁進行互動,FileSurfer 負責本地檔案的管理與導航,Coder 專注於程式碼的編寫與分析,而 ComputerTerminal 則提供控制檯訪問許可權,執行程式和安裝庫檔案。
- 該框架基於 AutoGen 打造,是一個通用框架。
- 附帶了 AutoGenBench 工具,專門用於評估智慧體的效能。
不足之處:
- 對開源 LLMs 的支援較為複雜,不易實現。
- 靈活性有待提高;從某種程度上看,它更像是一款應用,而非一個框架。
- 目前的文件資料和技術社群支援力度幾乎為零,尚需加強。
06 那麼,哪一款 Multi-AI Agent 框架最為出色?
以下是我的個人見解(我親身體驗過這些智慧體框架):
- 在軟體開發方面:AutoGen(由微軟推出) —— 它最適合處理程式碼生成和複雜的 multi-agent 編碼工作流任務。
- 對於初學者來說:OpenAI Swarm 和 CrewAI —— 這兩個框架操作簡便,非常適合剛接觸 multi-agent AI 且沒有複雜配置需求的新手使用。
- 處理複雜任務的首選:LangGraph —— 該框架提供了極高的靈活性,是為高階使用者設計的,支援自定義邏輯和智慧體編排(orchestration)。
- 在與開源 LLMs 的相容程度方面:LangGraph —— 它與開源 LLMs 的相容性極佳,支援多種 API 介面,這是其他一些框架所不具備的。CrewAI 在這方面也表現不俗。
- 技術社群支援最給力:AutoGen 擁有相當不錯的技術社群支援,能夠幫助使用者解決一些難題。
- 即開即用的選擇:CrewAI —— 它的配置快捷、操作直觀,非常適合用於演示或是需要迅速建立智慧體的任務。Swarm 和 Magentic-One 的表現也相當不錯,但社群支援相對較弱。
- 價效比之王:Magentic-One —— 它提供了一套預配置的解決方案,採用了通用框架的設計方法,可能在初期能夠節省成本。Swarm 和 CrewAI 在成本效益方面也值得關注。
Thanks for reading!
Hope you have enjoyed and learned new things from this blog!
About the authors
Mehul Gupta
GenAI Courses & Projects :
https://datasciencepocket.gumroad.com/
END
本期互動內容 🍻
❓你認為哪個框架最適合你的需求?為什麼?
原文連結:
https://medium.com/data-science-in-your-pocket/magentic-one-a...