今年年初,OpenAI 上線 Deep Research,開啟了智慧體又一新階段,其能根據使用者需求自主進行網路資訊檢索、整合多源資訊、深度分析資料,並最終為使用者提供全面深入的解答。
此後,Grok 3 及 Perplexity 等,它們都推出了類似的 Deep Research 服務。
其實,大家在驚歎 Deep Research 能力的同時,也會擔心資料隱私等安全問題。
現在,可以本地執行的 Deep Research 來了!
我們可以將其看作一個強大的 AI 研究助手,它使用多個 LLM 和網路搜尋進行深入的、迭代的分析。該系統可以本地執行,從而保護使用者隱私,你也可以使用基於雲的 LLM 以增強其功能。
目前專案已經收穫 1.4k star 量。
專案地址:https://github.com/LearningCircuit/local-deep-research
該專案具有以下特點:
先進的研究功能:
能夠自動進行深度研究,並在過程中提出智慧的跟進問題,以確保全面理解和深入挖掘主題;
追蹤引用來源,並驗證其可靠性和準確性,確保資訊的可信度;
透過多次迭代分析,該專案能夠逐步完善研究內容,確保覆蓋所有相關方面,避免遺漏重要資訊;
分析整個網頁的內容,而不僅僅是提取片段,從而提供更全面和準確的資訊。
對 LLM 靈活支援:
支援在本地裝置上執行 AI 模型(如 Ollama),確保資料處理的高效性和隱私性;
相容雲端大語言模型(如 Claude,GPT),從而提供更強大的計算能力和多樣化的模型選擇;
能夠無縫整合和使用 Langchain 框架下的所有模型;
使用者可以根據具體需求選擇和配置不同的 AI 模型,以最佳化研究效果。
豐富的輸出選項:
詳細的研究結果,並附帶引用來源;
生成內容詳實、結構清晰的綜合研究報告;
提供簡潔的摘要,幫助使用者快速抓住核心資訊;
自動追蹤資訊來源並驗證其可靠性。
增強的搜尋整合:
自動選擇搜尋源:對於使用者正在查詢的內容,自動搜尋引擎會進行智慧分析,並根據查詢內容選擇最合適的搜尋引擎;
整合了維基百科,方便快速獲取準確的事實性知識和百科資訊;
支援 arXiv 平臺,便於檢索和訪問最新的科學論文和學術研究成果;
整合 PubMed,提供生物醫學領域的最新文獻和醫學研究資源;
支援 DuckDuckGo 搜尋引擎,提供隱私友好的網頁搜尋體驗(但可能受到速率限制);
透過 SerpAPI 整合,可以獲取 Google 搜尋結果(需提供 API 金鑰);
支援 Google 可程式設計搜尋引擎,允許使用者建立個性化的搜尋體驗(需提供 API 金鑰);
整合 The Guardian(《衛報》),方便獲取最新的新聞文章和深度報導(需提供 API 金鑰);
支援透過本地 RAG 搜尋對私有文件進行搜尋,確保資料隱私;
能夠抓取並分析整個網頁的內容;
提供來源過濾和驗證功能,確保搜尋結果的可靠性和準確性;
使用者可以根據需求自定義搜尋引數,最佳化搜尋體驗。
本地文件搜尋(RAG):
基於向量嵌入的本地文件搜尋;
為不同主題建立自定義文件集合;
保護隱私,使用者文件保留在自己的機器上;
智慧分塊和檢索;
相容多種文件格式(PDF、文字、Markdown 等);
自動與元搜尋整合,實現統一查詢。
該專案還包括一個 Web 介面(如下所示),以提供更加使用者友好的體驗:
到底效果如何呢?我們以官方示例來說明,官方展示了一個關於核聚變能源發展的調查研究。
使用者提問:核聚變能源研究的最新進展是什麼?商業核聚變什麼時候可行?
然後 Deep Research 輸出了一篇可用的調查報告,內容非常詳實:
報告部分截圖
完整報告可參考:https://github.com/LearningCircuit/local-deep-research/blob/main/examples/fusion-energy-research-developments.md
透過這一示例,我們可以直觀瞭解到該專案在深度研究、跨領域分析和資訊整合方面的強大功能。
想要上手體驗的小夥伴,可以跟著官方教程進行部署,打造屬於自己的 Deep Research 了。