4月8日,有道知識庫問答引擎QAnything更新至1.3.0版本,該版本帶來了兩大主要功能升級:釋出純python的輕量級的版本,該版本支援在Mac上執行,也可以在純CPU機器上執行;同時支援BM25 + embedding混合檢索,可以實現更精準的語義檢索和關鍵字搜尋。本次更新後,QAnything能為開發者探索大模型落地提供更強大的技術支撐和更流暢的使用者體驗。
(QAnything 系統架構圖)
QAnything是網易有道自研的RAG(Retrieval Augmented Generation) 引擎。該引擎允許使用者上傳PDF、圖片、Word、Excel、PowerPoint等多種格式的文件,並實現類似於ChatGPT的互動問答功能,其中每個答案都能精確追溯到相應的文件段落來源。該引擎支援純本地部署,上傳文件數量無上限,問答準確率很高。
自今年1月開源以來,QAnything迅速吸引了開發者社群的廣泛關注,並多次登上了GitHub trending榜單。截至目前,在GitHub上QAnything已經積累7000+個星標,這反映出了使用者對其價值的高度評價。
(圖:QAnything登上GitHub trending榜單)
此外,QAnything下載次數已達數萬次。其中,語義嵌入排序模型BCEmbedding更是每月可達超60萬次下載。
值得一提的是,QAnything採用了自研的BCEmbedding模型(RAG系統關鍵模組)。有道發現,在客服問答以及一些toB客戶的場景中,OpenAI的Ada2 BCEmbedding檢索準確率只有60%,而其自研的 BCEmbedding檢索準確率可以達到95%。該模型具有中英雙語跨語種能力和多領域覆蓋兩大特色。
據悉,QAnything收集了包括教育、醫療、法律、金融、百科、科研論文、客服、通用QA等場景的語料,使得模型可以覆蓋和支援儘可能多的應用場景,為商業化落地提供了便捷。
目前,QAnything已在有道多場景中落地。如“有道領世”在QAnything的幫助下,憑藉海量的升學資料資料,打造出一個“私人AI規劃師”,能為每個家長和學生提供個性化的服務,展示更加全面、專業、及時的升學規劃。面對高考政策、升學路徑、學習生活以及職業規劃等各類問題,該系統的解答準確率超過95%。未來隨著資料補充和更新,準確率會一直上漲。
與此同時,子曰教育大模型最新應用成果“有道速讀”,其核心功能文件問答、文章摘要、要點解讀、引文口碑和領域綜述,背後驅動也是QAnything。在其加持下,使用者快速理解文件、定位要點等訴求得以快速實現,短短一分鐘,萬字長文就能拆解得明明白白。
除賦能自身業務外,開源後的QAnything不斷拓寬“朋友圈”。目前已累計為近百家企業賦能,以期讓AI應用真正進入醫療、物流、辦公等多元化場景,為企業、組織和個人帶來生產效率的大幅提升。
相關技術負責人表示,QAnything仍將不斷迭代,歡迎下載試用,https://github.com/netease-youdao/QAnything,期待更多使用者參與到反饋和開發中