極客說|多智慧體時代

微软技术栈發表於2024-12-06


「極客說」 是一檔專注 AI 時代開發者分享的專欄,我們邀請來自微軟以及技術社群專家,帶來最前沿的技術乾貨與實踐經驗。在這裡,您將看到深度教程、最佳實踐和創新解決方案。關注「極客說」,與行業頂尖專家一起探索科技的無限可能!投稿請聯絡:17278094563(微訊號)

本文涉及到的詳細測試程式碼和測試步驟放置於:
https://github.com/xinyuwei-david/david-share.git 下的:LLMs/Multi-Agent

本文中不再贅述程式碼實現。歡迎給 repo 點亮 Star,您的點贊是作者持續創作的動力。

近年來,生成式人工智慧領域掀起了一股“多智慧體”(Multi-AI Agent)熱潮,各大科技巨頭紛紛推出了自己的多智慧體框架。這些框架如雨後春筍般湧現,包括微軟的 AutoGen 和最新的 Magentic-One、OpenAI 的Swarm、LangChain 的 LangGraph 以及 CrewAI 等。然而,面對琳琅滿目的選擇,開發者們難免犯難:究竟哪一個多智慧體框架才是最適合自己的?為了幫助大家解開這個疑惑,本文將深入解析這些主流的多智慧體框架,詳細介紹它們的特點、優勢與不足,並結合例項,為您在選擇和應用時提供有價值的參考。

AutoGen(微軟)

框架簡介

AutoGen 由微軟推出,最初主要面向軟體開發任務。它採用了使用者代理(User Agent)和助理代理(Assistant Agent)的雙代理模式,為程式碼生成和執行提供強大的支援。

核心特點

  • 雙代理互動機制:使用者代理負責提供需求或提示,助理代理則根據這些需求生成並執行程式碼。
  • 程式碼生成與執行一體化:助理代理不僅能夠生成程式碼,還可以直接執行,並將結果反饋給使用者或其他代理。
  • 人性化的指導:在代理互動過程中,允許人類介入,提供指導或調整方向。
  • 強大的社群支援:得益於微軟的資源和影響力,AutoGen 擁有活躍的社群和豐富的資源。

優勢解析

  • 專業性強:高度適合複雜的軟體開發和程式碼生成任務。
  • 擴充套件性好:方便定製和擴充套件,滿足特定需求。
  • 資源豐富:大量的示例、文件和社群支援,降低了上手難度。

不足之處

  • 學習門檻較高:對於非程式設計師或程式設計經驗不足的使用者,可能不夠友好。
  • 配置複雜:尤其是在使用本地大型語言模型(LLM)時,需要進行復雜的設定,如配置代理伺服器等。
  • 領域侷限:在非軟體開發任務中,效能和效果可能不盡如人意。

適用場景與例項

適用於需要複雜程式碼生成和多代理協作的軟體開發任務。

例項

  • 自動化程式碼審查系統:利用使用者代理提交程式碼片段,助理代理進行程式碼審查、最佳化並返回改進建議。
  • 多模組協同開發:在大型軟體專案中,不同的助理代理負責不同模組的開發和測試,使用者代理協調整體進度。

CrewAI

框架簡介

CrewAI 以其直觀、易用的特點成為許多開發者快速構建多智慧體演示的首選。即使是非技術人員,也能在短時間內建立出功能豐富的多智慧體系統。

核心特點

  • 基於提示的簡單操作:主要透過編寫提示來控制代理行為,學習成本低。
  • 高效的代理建立:能夠在數分鐘內建立上百個代理,實現規模化。
  • 廣泛的 LLM 支援:透過與 LangChain 的整合,相容大多數 LLM 提供商和本地 LLM。

優勢解析

  • 易上手:對程式設計知識要求低,適合初學者和非技術人員。
  • 快速開發:非常適合需要快速構建原型或演示的場合。
  • 靈活性:在一定範圍內,可以方便地定製代理的行為和屬性。

不足之處

  • 功能深度有限:在處理複雜的程式設計或邏輯任務時,能力可能不足。
  • 互動不穩定:代理之間的互動有時可能出現Bug,影響體驗。
  • 社群資源有限:相比其他框架,CrewAI 的文件和社群支援較少。

適用場景與例項

適用於需要快速搭建、演示多智慧體系統的場合,特別適合非技術使用者。

例項

  • 客戶服務代理團隊:快速建立多個代理,分別負責解答不同型別的客戶問題,提升客服效率。
  • 市場調查助手:代理們協作收集、整理市場資訊,為決策提供支援。

LangGraph(基於 LangChain)

框架簡介

LangGraph 是基於 LangChain 構建的多智慧體框架,以其高度的靈活性和可定製性著稱。對於需要複雜邏輯和自定義的開發者來說,LangGraph 無疑是最佳選擇。

核心特點

  • 有向迴圈圖結構:基於有向迴圈圖(Directed Cyclic Graph),能夠清晰地表示代理之間複雜的依賴關係和互動流程。
  • 強大的擴充套件能力:支援幾乎任何型別的多代理編排應用,滿足高度定製化需求。
  • 豐富的社群資源:作為 LangChain 的擴充套件部分,享有其活躍的社群和大量資源。
  • 廣泛的 LLM 相容性:與開源 LLM 和各種 API 介面良好相容,提供更多選擇。

優勢解析

  • 高度可定製:開發者可以根據需求,自由設計代理的邏輯和互動方式。
  • 支援複雜任務:適合需要複雜邏輯處理、多步驟協作的任務場景。
  • 社群支援:大量的示例、文件和社群討論,幫助開發者快速解決問題。

不足之處

  • 學習曲線陡峭:需要開發者具備較強的程式設計能力,對圖結構和邏輯流有深入理解。
  • 文件有待完善:目前的文件可能不足以覆蓋所有功能,需要開發者自行探索。
  • 初學者不友好:對於程式設計新手,可能需要投入更多時間和精力。

適用場景與例項

適用於需要高度定製、複雜邏輯處理的多智慧體系統,適合有經驗的開發者。

例項

  • 智慧投顧系統:多個代理分別負責市場分析、風險評估、策略制定,為使用者提供個性化的投資建議。
  • 科研輔助平臺:代理團隊協作,從文獻檢索、資料分析到報告撰寫,支援整個科研流程。

OpenAI Swarm

框架簡介

OpenAI 推出的 Swarm 是一款面向新手的多智慧體框架,旨在以最簡單的方式幫助使用者入門多智慧體系統的構建。

核心特點

  • 簡潔明瞭:專注於簡化代理的建立和代理之間的上下文切換(稱為“Handoffs”)。
  • 快速上手:無需複雜的配置,即可開始構建多智慧體系統。
  • 專注於演示:非常適合用於建立簡短的演示或概念驗證。

優勢解析

  • 使用者友好:介面和操作簡潔,降低了入門門檻。
  • 快速構建:適合需要在短時間內展示多智慧體概念的場合。

不足之處

  • 相容性受限:目前僅支援 OpenAI 的 API,無法使用其他 LLM。
  • 功能有限:不適合用於生產環境,缺乏必要的擴充套件性和穩定性。
  • 社群支援不足:資源和支援較少,遇到問題可能難以及時解決。

適用場景與例項

適用於多智慧體系統的新手使用者,或需要快速建立演示的場合。

例項

  • 教學輔助工具:建立簡單的代理,幫助學生理解基本概念或解答簡單問題。
  • 基礎問答系統:搭建一個簡單的問答平臺,代理之間進行基本的資訊傳遞和協作。

Magentic-One(微軟)

框架簡介

作為微軟最新推出的多智慧體框架,Magentic-One 是在 AutoGen 的基礎上進行的簡化和最佳化,旨在降低使用門檻,讓更多使用者能夠方便地構建多智慧體系統。

核心特點

  • 預配置的代理集合:框架內建了一個協調者代理(Orchestrator)和四個功能代理:

    • WebSurfer:瀏覽和互動網頁內容。
    • FileSurfer:管理和訪問本地檔案。
    • Coder:專注於程式碼編寫和分析。
  • ComputerTerminal:提供命令列介面,執行程式和安裝庫。
  • 基於 AutoGen:繼承了 AutoGen 的優勢,同時簡化了操作。
  • 效能分析工具:整合了 AutoGenBench,用於評估代理的效能和效率。

優勢解析

  • 開箱即用:預設的代理和功能,無需複雜配置,節省時間和精力。
  • 使用者友好:介面直觀,適合非技術人員使用。
  • 效能視覺化:透過效能分析工具,直觀瞭解代理的執行情況,方便最佳化。

不足之處

相容性問題:在整合本地或開源 LLM 時,需要額外的配置和調整。

適用場景與例項

適用於希望快速搭建通用型多智慧體系統的使用者,特別是對技術要求不高的場合。

例項

  • 資訊整合平臺:利用內建的代理,完成從網路資訊收集、檔案管理到程式碼處理的全流程操作。
  • 自動化系統運維:透過 ComputerTerminal 代理,執行系統命令,管理伺服器和應用。

總結

  • 整體最強大和全面的框架:如果您追求功能深度和專業性,AutoGen 可能是最佳選擇。
  • 快速開發和易用性:如果您重視上手速度和簡便性,CrewAI 是理想的選擇。
  • 高度定製和複雜邏輯:需要深入定製和複雜功能時,選擇 LangGraph。
  • 成本效益和通用性:希望快速部署通用解決方案,Magentic-One 會是不錯的選擇。

資料推薦

  • 智慧 GitHub Copilot 副駕駛® 提示和技巧
  • Azure OpenAI 生成式人工智慧白皮書
  • 利用 AI 和 DevOps 重新定義開發人員體驗
  • SAP on Microsoft Cloud

相關文章