技能大模式Skill Model重磅釋出 浪潮"源"大模型加速AI生產力升級
北京 2022年6月30日 /美通社/ -- 近日,浪潮資訊釋出了基於"源1.0"大模型生成的4個技能大模型(Skill Model),分別為對話模型"源曉問"、問答模型"源曉搜"、翻譯模型"源曉譯"、古文模型"源曉文"。這些技能大模型在各自細分領域的精度業界領先,可直接應用於人機互動、知識檢索、語言翻譯和文學創作等領域,模型執行速度最高提升9倍。更重要的是,基於大模型快速生成特定領域的技能大模型(Skill Model),也意味著"源"的AI生產力大幅升級,能夠幫助商業組織和研究機構實現對AI技術的高效、快速和低成本應用,加速產業AI化。
技能大模型(Skill Model):大模型生產方式的新變革
應用場景的碎片化導致大量的定製化,是當前人工智慧從技術嚮應用轉化過程中,遇到的一個突出問題。千行百業使用人工智慧,如果一個場景一個場景的去定製,無論是時間成本還是人力成本都很高,維護的難度也很大。大模型的出現,使得模型的生產效率得到了極大的提高,技能模型就是典型的代表。
所謂技能大模型(Skill Model),是指面向特定行業或場景,透過知識蒸餾、模型裁剪、模型壓縮等技術,透過通用大模型生成具備該行業或場景所需特定技能的專業模型,在保留通用大模型的知識、認知推理能力及泛化能力基礎上,實現針對該領域的技能專業化、模型輕載化和呼叫標準化。
"技能大模型(Skill Model)"帶來了AI模型生產方式的新變革,將原本耗時數月經年的大模型開發訓練週期,縮短至短短數週,極大降低了開發與訓練成本。技能大模型(Skill Model)的價值在於,其針對特定領域進行了強化學習,能夠實現與通用的基礎大模型相當或更好的效能表現,且拿來即用,使用門檻更低,應用效果更佳。同時由於模型的輕載化特點,使其便於部署且消耗計算資源更少,能夠顯著減低使用成本和維護難度。
此外,技能大模型(Skill Model)還可以與通用大模型協同進化,它的執行結果反饋給通用大模型後,能夠讓通用大模型的知識與能力持續進化,即落地場景越多、模型進化得"越聰明",同時模型進化的速度也越快。
浪潮資訊副總裁劉軍表示:"研發大模型需要千萬元的訓練成本,海量資料集及巨大的算力資源,這對很多客戶來說是個巨大的門檻,我們希望透過"技能大模型(Skill Model)"的模型生產方式變革,推動AI生產力的升級,讓行業使用者甚至是中小使用者也能利用大模型開展深度創新,從而加速整個社會的智慧化升級。"
四大技能模型重磅釋出: 對話、問答、翻譯、古文
此次浪潮資訊釋出的四大技能模型(Skill Model),在繼承"源1.0"大模型通用的知識與能力基礎上,面向特定領域的場景進行針對性的技能最佳化,模型精度和訓練效率均處於業界領先:在十分之一引數量的情況下,即可在相同任務上覆現98%的通用大模型效果,推理速度最高提升9倍。
對話模型("源曉問")在源大模型基礎上,又採用了2660萬條醫療、法律、保險等不同行業,歷史、電影、娛樂等不同場景的對話語料資料進行強化訓練,在高頻閒聊、知識問答等開放式問答對話上表現突出,打榜業界權威測評WebQA開放問答資料集及CUGE兩項榜單均位居榜首。作為高水平對話問答技能模型,源曉問可廣泛應用於虛擬人、智慧助手、智慧客服等場景。目前已經有開發者在GitHub社群釋出了由源1.0進行角色扮演的劇本殺實錄,源1.0的場景化對話技能已經達到了"人機難辨"的程度。
翻譯模型("源曉譯")基於源大模型閱讀的海量高質量資料集,採用維基百科、書籍、聯合國檔案及字幕組等近80G高質量資料集進行強化訓練,因此翻譯不但流暢準確,同時更符合中文表述,在中譯英時表述更加專業地道,可輕鬆應對日常對話、新聞、哲學、小說等日常的語言翻譯任務。翻譯模型打榜業內權威WMT資料集及CUGE兩項榜單均位居榜首。
問答模型("源曉搜")連結了包含了維基百科、書籍等知識的資料庫,根據使用者提問的內容,利用高效能檢索方法,快速地從知識資料庫中檢索到與提問內容相關的內容作為背景知識,在相關專業知識背景下回答問題,能夠生成符合人類語言習慣的專業答覆。問答模型支援不同領域知識檢索,僅透過替換連結的知識庫便可實現在不同專業領域之間的適配,實現了搜尋和生成的一體化框架,能滿足不同領域知識檢索的需求,可廣泛應用於醫療、法律、保險及娛樂等領域的智慧客服、個人助理等場景。此前在打榜WebQA任務上,問答模型以55.97%的準確度在業界遙遙領先。
古文模型("源曉文")在源大模型精讀了5000GB高質量中文的基礎上,又學習了先秦到近代幾乎所有詩詞,並精選其中最優秀的10萬首進行強化訓練。海量學習兼針對性強化訓練使得古文理解模型能夠精通古詩詞的用詞、文法及平仄格律等規則,還擅長營造意境、引經據典,同時兼具古文解析的能力,因此古文模型能夠輕鬆解決今年高考古文翻譯、詩詞鑑賞等題目,在"金陵詩會"活動中,短短3天作詩近2000首,可廣泛應用於文學創作、古詩文教學、漢語言文化研究等場景中。
"源1.0"是浪潮資訊在2021年釋出的巨量中文語言模型,引數量高達2457億,比此前OpenAI釋出的GPT-3大模型,引數量增加40%,訓練資料集提升10倍,釋出時便問鼎中文語言理解評測基準CLUE榜單的零樣本和小樣本學習兩類總榜冠軍。目前,"源1.0"已經相繼完成了模型API、高質量資料集、模型訓練程式碼、推理程式碼和應用程式碼等等內容的開源開放,在GitHub社群、浪潮源官網均可以申請獲取相關的資源,已有超600家使用者藉助"源1.0"提供的資料集和API,構建了覆蓋金融、網際網路、醫療和自動駕駛等行業的高水平人工智慧應用。
來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/70004007/viewspace-2903853/,如需轉載,請註明出處,否則將追究法律責任。
相關文章
- 重磅:谷歌釋出最強大AI模型【Google Gemini】谷歌AI模型Go
- 通義千問2.0、阿里雲百鍊、升級AI平臺PAI 雲棲大會大模型釋出重磅來襲阿里AI大模型
- 浪潮資訊釋出源2.0基礎大模型,千億引數全面開源大模型
- 加速產業AI化!浪潮提出”元腦“生態計劃,要成就行業AI大腦產業AI行業
- 定位產業AIGC化加速器 “雲闕AI”大模型垂直應用正式釋出產業AIGC大模型
- 松鼠Ai全新多模態智適應大模型釋出會重磅召開,智適應教育軟硬體全面升級AI大模型
- 重磅升級!TDengine3.0 正式釋出
- 用大模型開啟AI新時代,悠絡客UMind新品重磅釋出大模型AI
- 【重磅】華為雲盤古大模型5.0,正式釋出!大模型
- USDD重磅升級,引領超抵押浪潮
- 印象筆記釋出自研大模型,全新的生產力工具要來了?筆記大模型
- 阿里雲全站加速DCDN重磅升級阿里
- 曠視“天元”開源2週年釋放AI生產力AI
- 合合資訊大模型“加速器”重磅上線大模型
- 有趣的大模型之我見 | Llama AI Model大模型AI
- HDC.Cloud 2021:華為釋出6大創新產品,加速行業全面雲化和智慧升級Cloud行業
- 中國算力大會,聯想重磅釋出兩款明星算力新品
- PODsys:大模型AI算力平臺部署的開源“神器”大模型AI
- PODsys:大模型AI算力平臺部署的開源"神器"大模型AI
- 開啟文心大模型,一看全是生產力大模型
- AI浪潮下12大開源神器介紹AI
- 強大生產力工具AlfredAlfred
- PLM注重三大生產力
- 浪潮助力手機大資料平臺升級大資料
- 地平線大算力征程5晶片釋出,哪吒汽車智慧化生態升級打造晶片
- AI 大模型應用開發實戰(04)-AI生態產業拆解AI大模型產業
- 2023雲棲大會關鍵詞:開放、大模型、MaaS、產業智慧升級大模型產業
- 數字化安全生產平臺 DPS 重磅釋出
- 近期大模型AIGC概要:Adobe釋出AI編輯影片等大模型AIGC
- 大模型Grok-1.5釋出大模型
- 20大AI專案斬獲AI生產力創新獎!四大領域全面開花AI
- 華為智慧雲網:全面升級、釋出新品、擴大生態
- 6大新品重磅釋出,華為雲全棧雲原生技術能力持續創新升級全棧
- 騰訊湯道生:雲智融合,加速產業智慧升級產業
- Zeu.js 1.0.0 釋出, 九大全新元件全面升級JS元件
- 全新升級!《雲原生架構白皮書 2022 版》重磅釋出架構
- 雲資料庫PostgreSQL版重磅升級開年釋出會資料庫SQL
- 天雲資料釋出私域資料大模型Elpis 將大模型能力應用於產業原生動力即工程領域大模型產業