今年年初,英偉達 CEO 黃仁勳因為勸人「別再學習計算機」被送上熱搜。但其實,他的原話是「過去,幾乎每個人都會告訴你,學習計算機至關重要,每個人都應該學會程式設計。但事實恰恰相反,我們的工作是創造計算技術,讓大家都不需要程式設計,程式語言就是人類語言。」
程式設計,是為了不再程式設計,這一願景由來已久,而且在大模型出現之後逐漸成為可能。但在現階段,直接把一個大模型丟給某個人或某個企業去用效果仍然不好。比如,你不能指望一個不會寫 Prompt 的人利用大模型去構建一整個網站,也不能指望一個沒有配置 AI 人才的公司把某個大模型變成公司「智囊」。
也就是說,現在的大模型離「開箱即用」還有一段距離。
不過,在 5 月 17 日的騰訊雲生成式 AI 產業應用峰會上,我們看到了可以縮小這一距離的產品,比如能呼叫騰訊官方外掛和知識庫的一站式 AI 智慧體創作與分發開放平臺 —— 騰訊元器,能幫助一線業務人員用好大模型解決實際業務難題的騰訊雲大模型知識引擎、騰訊雲大模型影像創作引擎、騰訊雲大模型影片創作引擎等。
為這些產品提供支撐的騰訊混元大模型能力也在持續升級,部分中文能力已追平 GPT-4,支援 16 秒影片生成。目前,騰訊混元 hunyuan-pro、hunyuan-standard、hunyuan-lite 等多種尺寸模型,已透過騰訊雲,面向企業、開發者全量開放。其中 hunyuan-standard 支援 256K 上下文,長文件理解和處理能力更強了。
在這次全新發布中,知識引擎是一款比較有代表性的 PaaS 類產品,可以讓企業 5 分鐘就開發出一款客服營銷、企業知識社群類知識服務應用。這類大模型平臺的出現打破了人人都需要掌握大模型複雜用法的局面,讓大模型離產業更近了。
利用知識引擎,企業使用者只需要輸入模型選擇、角色設定、知識庫管理等基本資訊,5 分鐘就可以搭建出一款知識應用。
量產「銷冠」、5 分鐘建立智慧助手
知識引擎是怎麼做到的?
如果你在影片號上關注過一個叫「李蠕蠕」的博主,那你一定看過她的「銷冠」系列。在影片中,她扮演的銷冠角色會展示不同的銷售策略,比如如何透過判斷顧客的心理和需求來推銷產品、如何應對還價、如何判斷顧客的購買力等。批次複製這類「銷冠」是每一個公司的夢想。
騰訊雲知識引擎有助於實現這個夢想。它利用「LLM+RAG」的技術路線,可以幫企業輕鬆搭建融合了自己私有領域知識庫的問答助手。如此一來,每個員工都能夠以問答的形式迅速獲取公司知識,學習「老員工」經驗,快速提升業務能力。
某公司利用騰訊雲知識引擎構建了一個「保險經紀人銷售助理」,透過生成保險產品知識和安撫話術來輔助保險經紀人。其問答準確率由傳統機器人的 57% 提升至 85%,保險經紀人人均提效 50%。
而這個過程之所以這麼輕鬆,是因為騰訊雲知識引擎封裝了一些好用的模型和工具。
騰訊雲大模型知識引擎聚焦全技術鏈路提升,當使用者提問時,知識引擎會先透過 RAG(檢索增強生成),從一個龐大的文件集合(企業知識庫)中檢索出相關的文件片段,然後把這些資訊按照一定的規則重新排列,轉換成 prompt 輸給大模型(LLM)。大模型會基於這些內容生成回答。這種方式相當於帶著「課本」去考試,可以大幅度降低幻覺,回答內容更安全可靠。
整合 OCR 大模型,文件識別準確率提升 30%
在利用知識引擎構建應用後,企業首先需要匯入自己的知識庫,以供檢索。在這一環節,文件排版的複雜性決定了,解析這些知識不是一件容易的事,要克服圖文混排處理、結構化表格識別、公式識別、流程圖識別、閱讀順序保持等諸多問題。
針對這些問題,騰訊雲知識引擎整合了 OCR 解析大模型,透過三個步驟來解析文件:
第一步是版面分析,即利用自研的版面分析演算法定點陣圖像中所有版面元素(包括段落、表格、圖片、標題等)的位置、順序和型別;
第二步是透過文字識別、表格識別等精準匹配的垂類識別演算法來識別、提取不同元素的內容;
第三步則是將識別結果按照人的閱讀順序整合成 Markdown 格式檔案進行輸出,保證資訊的連貫性和易讀性。
其中,表格、公式的情況較為複雜,比如有些表格可能沒有框線。針對這類問題,OCR 大模型透過融合行列關係特徵和元素特徵來預測表格的行列間隔線。這樣一來,即使表格沒有明顯的框線,也能透過演算法推理出結構。此外,這個 OCR 大模型還能識別跨頁合併表格、多行表等,對科研論文場景的複雜公式解析效果也比較好,是國內少數能夠與海外頂尖模型(如 Google 的 MP 模型)相媲美的模型之一。
整體來看,OCR 解析大模型將文件識別的準確率提升了 30%。這種對文件結構的深入理解對於處理更復雜的任務至關重要,比如資訊的歸納、總結、對比分析和數值計算等。
提出業內首個語義切分大模型,回答完整性提升 20%
讓 OCR 解析大模型把知識解析出來,就能進行檢索了嗎?不,中間還有一個重要的步驟 —— 知識切分。
知識切分的難點在於如何準確地識別出某些資訊屬於一個資訊塊,並將其完整地切出來,比如跨頁的流程圖、表格。傳統的切分方法是按照規則去切分,但不同的內容往往需要不同的切分方式,這使得切分規則變得異常複雜,不易維護。
為了解決這一問題,騰訊雲推出了業內首個基於語義判斷的知識切分大模型。和傳統切分方法不同,它不需要你告訴它如何切分,而是自己去理解整篇文章的一級、二級、三級段落是怎樣的分佈,實現端到端的切分。這得益於模型在預訓練過程中獲得的語義理解、長上下文關聯能力。此外,巧妙設定 prompt、構造微調資料也起到了很大作用,使大模型能夠適應長文字切分需求並有較快的推理速度。
透過準確的知識切分,大模型可以更有效地支援檢索,讓檢索系統可以基於更合理、語義更完整的文字塊進行搜尋,從而提高檢索的準確性和效率。在這個模型的幫助下,知識引擎的回答完整性提升了 20%。
自研長文字 Embedding 模型,上萬行超大表格也能檢索
在文件被充分解析、恰當切分後,檢索過程就能更加順利地進行了。不過,如何從海量的多模態資料中檢索到最相關的資訊依然是一大挑戰。
騰訊雲知識引擎從兩個方向入手來最佳化檢索效果。首先,透過自研的長文件 Embedding 模型,它把檢索最大長度從 512 提升到 4K,以支援更復雜的長文字檢索任務。在國際知名的 C-MTEB 榜單上,該模型在 8 箇中文任務上可以達到效果最優。
其次,它支援向量關鍵詞檢索、表格文字混合檢索等多種檢索策略,這使其檢索能力不僅限於傳統的文字檢索,還支援大型複雜表格等複雜檢索需求。甚至,對於上萬行、上百列的超大表格,知識引擎也能從容應對。
這些檢索到的資訊是大模型回答使用者問題的重要依據,有助於提高生成文字的質量和可靠性。
整合多模態、多行業大模型,應對多樣提問
在檢索過程完成後,大模型會得到一個包含答案線索的 Prompt,用於回答使用者提問。
這些問題有時會很專業,涉及到行業術語和規範。比如一個「教案助手」必須知道教案需要包含哪些內容,以何種形式編寫。為此,騰訊雲在通用大模型的基礎上,深入了上百個使用者場景,融入了大量的垂直領域知識,訓練、調優了多個行業大模型,以降低特定行業的落地成本。
河南省數字教育發展有限公司基於騰訊知識引擎打造的智慧教育平臺,面向河南省上萬所中小學打造教師助理及學生助手,百科 + 教學輔助場景評測端到端知識準確率高於 90%。
此外,使用者的提問可能會非常多元,不僅有文字,還會附上圖片、文件、表格甚至非常複雜的流程圖。為了解決這些問題,騰訊雲知識引擎整合了多模態大模型的能力,支援資料表、資料圖、操作圖等圖文交錯的多輪問答,能夠滿足各種真實場景的需求。
當然,在問答過程中,知識引擎也會遇到一些解決不了的問題(bad case)。但好在,它的背後還有一個強大的底座 —— 騰訊雲 TI 平臺。TI 平臺上有一整套資料處理、模型精調工具,可以將 bad case 轉化為有價值的訓練資料,還有 100 多種任務型別的精調配比資料可供選擇,幫助進一步提升模型效能。這是很多知識引擎類應用所不具備的優勢。
多個開箱即用平臺齊發
瞄準「產業實用」
除了知識引擎,騰訊雲這次還發布了其他幾個開箱即用的平臺,包括騰訊元器、影像創作引擎、影片創作引擎等。
其中,騰訊元器是一個智慧體創作和分發平臺,主打「低門檻」。透過提示詞、外掛、工作流、AI 輔助建立等能力,每個人都可以在幾分鐘內透過打字、點選等簡單操作構建自己的專屬智慧體。
而且,元器平臺上預整合了騰訊生態特色外掛、知識庫資源,還將開放第三方能力,豐富智慧體的功能。
建立完成後,你可以將這些智慧體釋出到 QQ、微信或 APP 上,優質智慧體有機會獲得流量扶持。
影像創作引擎支援影像風格化、AI 寫真、線稿生圖等能力,可以大幅縮短素材創作和生產週期。
影片創作引擎支援影片風格化、運動筆刷、畫布擴充等影片 AI 創作能力,還能一鍵轉譯影片語言,幫助企業投放海外市場。
這些引擎和知識引擎共同組成了大模型時代原生工具鏈,體現了騰訊雲「產業實用」的大模型核心戰略。
這一戰略可以被解讀為:如何讓使用者以最低的成本或門檻、最小的必要輸入來獲得最佳的大模型應用實踐。
這一價值主張在知識引擎等產品中有多種體現。從整體來看,它有工具層、模型層和應用層的全方位支援,而不僅僅是模型本身,而且解決方案涵蓋了從資料處理、模型訓練、應用開發到最終的部署和運維等多個環節。
從細節來看,它沒有限制底層的大模型,而是以實用為判斷標準,提供了混元大模型、精調的行業大模型、客戶定製大模型以及基於第三方大模型精調而成的知識引擎專用模型等多種選擇,幫助企業控制成本。此外,它的接入方式也非常簡單,提供開箱可用的應用模板和可被整合的原子能力 API 兩種便捷使用方式,把門檻降到無限接近於 0。
就像騰訊集團高階執行副總裁、雲與智慧產業事業群 CEO 湯道生所說,「大模型的打造只是起點,把技術落地到產業場景,創造價值才是目標」。我們也期待看到更多這類「產業實用」的大模型應用產品出現。