上海人工智慧實驗室、 華東師範大學、 普林斯頓大學、 香港大學推出《OS-Copilot:邁向自我完善的多面手計算機代理》
這是一個構建通用代理的框架,能夠與作業系統 (OS) 中的綜合元素(包括 Web、程式碼終端、檔案、多媒體和各種第三方應用程式)進行互動。
特點:
- 使用 Python 程式碼和 GPT-4 語言模型提示的混合構建了一個名為 Friday 的代理;
- 控制 Linux 或 Mac OS 計算機,
- 包括瀏覽器、Excel 和 PowerPoint,用於執行任務;和
- 自我提升
如何做到:
- 建立了一套順序提示和程式碼,按代理進行分組,如
- 規劃員--將使用者請求分解為更小的任務
- 配置器--中介軟體,用於接收每個任務,並用記憶體中的資料或工具庫中的方法對其進行配置,然後再傳遞給執行器
- 宣告式記憶體--使用者配置檔案和以往操作的歷史記錄
- 工具庫--可用工具
- 工作記憶--儲存任務的下一步和以前的歷史記錄
- 執行器 - 生成可執行命令
- Critic評估者--評估任務是否已成功完成或是否需要反覆執行
結果:
- 在一般代理的基準測試中,Friday(代理框架)的效能優於帶外掛的 GPT-4
- 它能在 Excel 和 PowerPoint 中執行任務,在Web檢索、Excel和Powerpoint使用方面的基準測試中,表現優於GPT-4
說明什麼?
- 這實際上是 Andrej Karpathy 提出的人工智慧作業系統的工作演示
- 這個想法已經流傳了一段時間
- 這些系統會變得更好