質量超越o1，成本僅4%，UCSD張怡穎教授團隊開源生成式AI工作流自動最佳化器

机器之心發表於2024-12-04

原文網址 : https://www.jiqizhixin.com/articles/2024-12-04-5

AIxiv專欄是機器之心釋出學術、技術內容的欄目。過去數年，機器之心AIxiv專欄接收報導了2000多篇內容，覆蓋全球各大高校與企業的頂級實驗室，有效促進了學術交流與傳播。如果您有優秀的工作想要分享，歡迎投稿或者聯絡報導。投稿郵箱：liyazhou@jiqizhixin.com；zhaoyunfeng@jiqizhixin.com

近幾年在生成式 AI 技術和商業創新飛速發展的背景下，建立高質量且低成本的生成式 AI 應用在業界仍有相當難度，主要原因在於缺乏系統化的除錯和最佳化方法。

近日，UCSD 張怡穎教授的 GenseeAI 團隊推出了首款可自動提升 AI 工作流生成質量並降低生成成本的工具 Cognify。Cognify 可以自動最佳化 AI 工作流，支援 LangChain、DSPy、Python 等語言框架。Cognify 的核心思路是一種創新的分層工作流級最佳化方法。Cognify 可將生成式 AI 應用的生成質量提高多達 48%，並將執行成本降低多達 90%。Cognify 現已開源。

開源地址：https://github.com/GenseeAI/cognify

生成式 AI 工作流

當前的生成式 AI 產品通常都是以生成式 AI 工作流的形式構建和部署。AI 工作流內部可以呼叫各類 AI 模型、工具、資料來源及其他型別的系統。典型的 AI 工作流包括 Agent 工作流和 LLM+RAG 等。

與單次呼叫 AI 模型相比，AI 工作流提供了更強大、可定製和整合化的解決方案。當前業界的 AI 工作流通常由工程師編寫。在部署之前，工程師需要手動調整 AI 工作流的結構和提示詞（prompt），併為工作流中的各個步驟選擇合適的模型。

然而，由於缺乏系統化的調優方法，AI 工作流的部署經常非常耗時，已部署的工作流也可能面臨質量不佳、不穩定或成本太高等問題。雖然有許多生成式 AI 工作流的開發框架，比如 Coze，Dify，LangChain，DSPy 和 Claude MCP，但是並沒有可以幫助開發者系統除錯和最佳化工具。

Cognify 最佳化器

Cognify 是一款全面、多目標的開源 AI 工作流最佳化器。Cognify 的最佳化過程基於自動選擇 AI 模型、改進工作流結構和增強提示詞。Cognify 實現了工作流的多目標最佳化，包括提高生成質量和低生成成本。

對於不同的應用場景，Cognify 都用相同或更小的模型達到了更高的生成質量，推動了質量 - 成本 Pareto 邊界，並且允許使用者選擇不同的質量 - 成本組合（結果如下圖所示）。在此過程中，Cognify 的最佳化實現了「一鍵」全自動化。

同時，Cognify 也允許使用者自定義最佳化方法 Cogs（Cognify 把各種最佳化統稱 Cog），備選模型種類，以及最多最佳化次數。Cognify 目前支援 LangChain、LangGraph、DSPy 和基於 Python 開發的工作流。

Cognify 核心技術

全域性級別的工作流超引數調優

Cognify 的核心理念是對整個工作流進行最佳化，而不是在每個單獨的工作流元件中進行最佳化。由於上游元件的生成結果對下游元件的效能有重大影響，孤立的最佳化各個元件可能導致最終生成質量不佳，而且整體執行成本增加。

Cognify 透過實驗各種 Cog 組合，並透過最終生成的質量評估這些組合的效果，從而最佳化整個工作流。

在整體工作流最佳化中，一個關鍵挑戰是最佳化成本，包括模型執行成本和耗時。一個簡單的做法是對每個可能的 cog 組合進行網格搜尋，但這會導致指數級增長的最佳化成本。為了解決這個問題，Cognify 採用了兩種策略。

首先，Cognify 將工作流視為一個最佳化物件，並將所有可能的 Cog 視為其超引數 (hyperparameter)。Cognify 為工作流超引數設計了一套新的貝葉斯最佳化器（Bayesian Optimizer），用於調優這些工作流超引數。特製的最佳化器能夠有效探索 cog 組合空間。其次，Cognify 將 cog 分為兩層：外迴圈包含更改工作流結構的 cog（例如新增或移除元件或重新排列它們的順序），內迴圈包含不影響工作流結構的 cog（例如提示詞調優和模型選擇）。這種雙層方法減少了貝葉斯最佳化器需要探索的整體搜尋空間。

CogHub：AI 工作流最佳化器集合

與 Cognify 同時推出的是 CogHub——一個開源 cog 集合。就像 HuggingFace 集合了開源的模型，CogHub 集合了開源的 AI 工作流最佳化方法。CogHub 在被 Cognify 內部呼叫的同時也面向程式設計師或未來的生成式 AI 工具。

CogHub 現支援以下五種 cogs：

任務分解 (Task Decomposition)（外迴圈）：將一個任務（一次 LLM 呼叫）分解為多個細分的子任務（多次 LLM 呼叫）。
任務整合 (Task Ensemble)（外迴圈）：構建並結合多個模組來完成任務。
多步推理 (Multi-step Reasoning)（內迴圈）：要求 LLM 逐步推理。
少樣本學習 (Few-shot Learning)（內迴圈）：從輸入樣本中新增一些高質量的示例演示。
模型選擇 (Model SelectioN)（內迴圈）：評估不同的模型。

最佳化案例

以下是一個資料視覺化任務的例子。任務目標是由手機銷售資料生成針對每個廠商每個季度的銷量的箱型圖，並計算每個手機商的銷售平均值，最終用平均值線表示。

下圖展示了幾個生成圖的對比， 1) 人工畫的基準圖，2) 直接詢問 OpenAI o1，3) 直接執行 MatPlotAgent 工作流，4) DSPy 最佳化過的工作流，以及 5) 由 Cognify 最佳化過的工作流。Cognify 最佳化過的工作流返回的結果幾乎與基準圖吻合，質量顯著優於其他方案。與此同時，Cognify 最佳化過的工作流的執行成本僅有 o1-preview 的 4%。

^{圖 A：人工畫的基準}

^{圖 B：GPT o1-preview 的生成圖}

^{圖 C：原生成式 AI 工作流的生成圖}

^{圖 D：DSPy 最佳化過的生成式 AI 工作流生成圖}

^{圖 E：Cognify 最佳化過的生成式 AI 工作流生成圖}

GenseeAI 簡介

GenseeAI（gensee.ai）是由 UCSD 張怡穎教授帶領的初創公司。GenseeAI 致力於生成式 AI 工作流最佳化、部署、推理和基礎平臺建立，目前已在多家世界 500 強公司推廣初期產品。張怡穎教授師從圖領獎得主 David Patterson 學門，是計算機系統領域的國際頂尖專家，獲得業界和學術界多項大獎和廣泛認可。GenseeAI 的其他核心團隊來自於美國谷歌和 Snap 等高科技公司，具有開發和運營日活躍使用者上億級別的 AI 產品的經驗。

研發團隊資源成本最佳化實踐
2019-02-22
MetaGPT開源自動生成智慧體工作流，4.55%成本超GPT-4o
2024-11-09
GPT智慧體
BigCode：使用AI自動生成程式碼的開源工具
2022-09-30
GCAI開源工具
生成394,760種蛋白質表徵，哈佛團隊開發AI模型，全面理解蛋白質上下文
2024-07-26
AI模型
輕量開源！微軟基礎模型LLaVA-Rad：自動生成高質量放射學報告
2025-02-12
微軟模型
創新能力超越AI Scientist，上海AI Lab「AI 科研團隊」VirSci來了
2024-11-04
AI
研發團隊資源成本優化實踐
2019-02-22
優化
港科大開源VideoVAE+，影片重建質量全面超越最新模型
2024-12-30
IDE模型
閒談團隊的程式碼質量
2019-03-01
Leaf：美團分散式ID生成服務開源
2019-03-08
分散式
技術團隊運用度量驅動開發提升質量：策略與實踐
2023-10-26
3D資產生成領域福音：自動化所、北郵團隊聯合打造材質生成新正規化
2024-05-30
3D
僅用4塊GPU、不到3天訓練出「開源版GPT-4o」，這是國內團隊最新研究
2024-09-23
GPUGPT
[小團隊自動化] （一） Drone CI For Github —— 打造自己的CI/CD工作流
2019-03-08
Github
北京大學彭宇新教授團隊開源最新多輪互動式商品檢索模型、資料集及評測基準
2025-03-04
模型
全面超越DPO：陳丹琦團隊提出簡單偏好最佳化SimPO，還煉出最強8B開源模型
2024-05-27
模型
如何提升團隊速率、保證產品質量和提升團隊積極性？
2019-07-06
遊戲開發原理——手遊開發團隊與成本
2019-12-20
遊戲開發
0.5秒，無需GPU，Stability AI與華人團隊VAST開源單圖生成3D模型TripoSR
2024-03-05
GPUAIAST3D模型
2024/4/19日團隊開發
2024-04-19
用 ai 自動生成 unit test
2024-09-06
AI
歷時2年，華人團隊力作，震撼開源生成式物理引擎Genesis，可模擬世界萬物
2024-12-19
影片生成要有自己的系統！尤洋團隊歷時半年開源VideoSys
2024-08-26
IDE
使用API自動生成工具優化前端工作流
2019-03-04
API優化前端
[小團隊自動化] （三）輕量化自建 Drone CI For Gitea —— 打造自己的CI/CD工作流
2019-03-08
Git
團隊效率-基建開源（持續更新）
2020-04-06
首個o1復現開源RL框架OpenR來了，UCL、上交等高校聯合團隊釋出
2024-10-14
框架
Nature 機器智慧綜述：AI如何自動生成遊戲
2020-09-08
AI遊戲
介面自動化從個人走向團隊協作開發
2020-10-19
o1 研發團隊完整採訪：Ilya早期曾參與，靈感源於AlphaGo
2024-09-22
Go
ChatUML：AI自動生成UML圖表
2024-12-30
AI
剛剛，開源大模型的新王誕生了：超越GPT-4o，模型還能自動糾錯
2024-09-06
大模型GPT
大模型與生成式AI有本質區別
2024-06-03
大模型AI
優思學院｜質量成本是什麼？質量成本最佳化的目的？
2023-04-13
Activiti工作流學習筆記(三)——自動生成28張資料庫表的底層原理分析
2021-03-13
筆記資料庫
團隊作業4
2024-11-11
自動生成正規表示式
2020-08-19
Spark團隊開源新作：全流程機器學習平臺MLflow
2018-06-06
Spark機器學習

質量超越o1，成本僅4%，UCSD張怡穎教授團隊開源生成式AI工作流自動最佳化器

相關文章