不到24小時,開源版Deep Research瘋狂來襲!一月少花1400

机器之心發表於2025-02-04

OpenAI 被開源包圍了。

昨日,AI 社群最大的新聞當屬 OpenAI 釋出的全新智慧體 Deep Research 了!

作為一個使用推理來綜合大量線上資訊併為使用者完成多步驟研究任務的智慧體,Deep Research 旨在幫助使用者進行深入、複雜的資訊查詢與分析。

圖片

顯然,對於那些在金融、科學、政策和工程等領域從事密集知識工作並需要徹底、精確和可靠研究的使用者而言,Deep Research 稱得上研究神器了。

專案負責人之一 Zhiqing Sun(孫之清)本科畢業於北京大學電腦科學與技術系。2019 年起在 CMU 語言技術研究所攻讀博士學位,現為 OpenAI 研究科學家。

圖片

遺憾的是,Deep Research 目前僅供 Pro 訂閱使用者使用,每月 200 美元著實令很多人望而卻步。

圖片

所以,在 Deep Research 釋出之後,各種開源復現版本紛至沓來。

從 OpenAI 釋出的官方部落格來看,Deep Research 用到了端到端的強化學習,並且在多個領域的複雜瀏覽和推理任務上進行了訓練,因此才有了現在的效能。

其實,早在去年,來自位元組跳動 ByteDance Research 的研究人員就提出了基於強化學習(Reinforcement Learning, RL)的 LLM Agent 框架 ——AGILE。該研究已被NeurIPS接收,這應該是學術界第一個用強化學習做Agent的端到端訓練的工作。瞭解更多內容可以參考機器之心此前報導《端到端最佳化所有能力,位元組跳動提出強化學習LLM Agent框架AGILE》。

接下來,我們看看在一天之內,都有哪些 Deep Research開源復現專案。

一、Open Deep Research

其中一個開源復現版本為「Open Deep Research」。

圖片

專案地址:https://github.com/nickscamara/open-deep-research

具體而言,Open Deep Research 是一個 AI 智慧體,可以對大量的 web 資料進行推理,該方法沒有使用 o3 的微調版本,而是使用了爬蟲工具 Firecrawl 的提取 + 搜尋功能以及推理模型來深入研究網路。

專案主頁還放出了 demo 展示,我們可以發現,在詢問 Open Deep Research 關於「2025 年 B2B 領域最大的創業機會」時,Open Deep Research 給出了思考過程,答案也相當完美。不到24小時,開源版Deep Research瘋狂來襲!一月少花1400

根據專案介紹,我們可以得知 Open Deep Research 背後預設的模型為 gpt-4o,如果你想換個其他模型使用也是可以的,只需幾行程式碼即可切換為 Anthropic、Cohere 等釋出的模型。

二、OpenDeepResearcher

另外一個比較熱門的復現專案為「OpenDeepResearcher」。

圖片

專案地址:https://github.com/mshumer/OpenDeepResearcher

作為一個開源的 AI 智慧體,OpenDeepResearcher 可以提供全面的研究。使用者只需提供一個主題,該智慧體就會展開研究,並返回一份綜合報告。

其工作過程非常簡單,對於給定的查詢,OpenDeepResearcher 執行以下步驟:

  • 執行搜尋,檢視結果頁面,並提取重要資訊;
  • 如果它想深入瞭解,其可以重複此過程,並提出新的查詢;
  • 完成後,它會使用上下文生成報告。不到24小時,開源版Deep Research瘋狂來襲!一月少花1400

    三、node-DeepResearch

    最後一個復現專案是「node-DeepResearch」,它是由 Jina AI CEO 肖涵(Han Xiao)建立。

    他表示,OpenAI 的 Deep Research 只是在 while 迴圈中進行「搜尋 + 讀取 + 推理」。他在 nodejs 執行環境中,使用谷歌 gemini-flash 和 jina reader(Jina AI 推出的開源工具,將網際網路上的 HTML 網頁內容轉換為適合 LLM 處理的純文字格式)進行了復現。

    圖片

    我們來看下執行效果。

    下面是「jina ai 最新部落格文章內容是什麼」(what is the latest blog post from jina ai)的 2/3 步搜尋示例:首先找到 jina ai 新聞網站、閱讀其內容,然後確定最新帖子內容。

    圖片

    下面影片是關於「who is the biggest, cohere, jina ai, voyage」的 13 步查詢,經過搜尋、反饋、迴圈之後,結果是正確的(cohere)。這裡影片 2 倍加速。不到24小時,開源版Deep Research瘋狂來襲!一月少花1400

    對於 node-DeepResearch,顯然缺少了微調 o3 推理模型的支援。

    圖片

    有人認為,這個專案實現了 OpenAI 準備了半年多的東西所做到的功能。還有人呼籲,趕緊把 UI 做得漂亮一點。

    圖片

    目前,該專案已經收穫了近 700 個 Stars。

    圖片

    專案地址:https://github.com/jina-ai/node-DeepResearch

    相信後續會有更多類似的開源智慧體專案出來。

相關文章