頻頻破圈,走向百業:大模型的畢業季
人間六月,滿眼芳菲。很多人將在這時迎來人生中又一個畢業季。與熟悉的課堂、校舍、同學道別,走向新的學府,或者走向自己選擇的行業。
這個情感濃烈的六月,卻與往昔有點不同。除了人類的青春故事依舊精彩,AI大模型也在畢業季頻頻出圈。最近,百度的數字人度曉曉,向我們完美展示了一枚AI同學如何度過一個完美六月。先是寫高考作文,後是畫作參加美院畢業展,緊接著還跟龔俊一起創作音樂。難怪很多同學表示,我的畢業季可沒有AI那麼精彩……
支撐度曉曉實力破圈的,是百度自主研發的文心大模型。
幾年以來,大模型可以說是AI領域,乃至整個科技界的核心熱詞之一。我們經常會聽到某公司/科研機構訓練了新的大模型,引數規模打破了記錄;卻很少聽到某行業/領域真的用到了大模型。從2018年十月谷歌AI釋出bert開始算起,大模型到這個六月正好度過了“大學四年”。換言之,這項被賦予期望的技術,也該迎接自己的畢業季了。
此前,我們看到的是大模型無盡的提升訓練模型引數,無盡的重新整理資料集測試分數,並且有各種各樣新的技術思路加入大模型訓練。但面向未來,我們可能只需要以一種思路來評判大模型:能不能帶來產業價值。
度曉曉的出圈,確實重新整理了很多人對AI的認識。但更重要的是它透過一系列動作,向產業證明了預訓練大模型如何跨越技術屏障,真正與產業結合,向開發者與千行百業開放生態。
2019年,百度率先發布了中國首個正式開放的預訓練模型ERNIE1.0,開啟了中國大模型的“入校生涯”;2022年,文心大模型第一個衝出實驗室、資料集的大門,引領了全球大模型的“產業歲月”。
能夠做到這一切的原因,在於文心大模型正確回答了三道“畢業考試題”。
先答這道“證明題”:一系列出圈動作背後的技術跨越
短短几天之內,百度數字人度曉曉首先挑戰高考作文。參與作答了全國新高考Ⅰ卷的《本手、妙手、俗手》議論文寫作,40秒就根據題目創作了40多篇文章,平均1秒生成1篇,隨機抽取其中一篇,分數已趕超約75%高考考生。
緊接著,度曉曉帶著她的畫作參加了西安美術學院2022年“時空留痕·無界西美”本科畢業展,開設了自己的專屬展區。她平均只需數十秒就能完成一幅有意味,充滿鮮明藝術特質的畫作,被美院老師評為已經具有畢業生水平。
這兩件事當然讓AI數字人實力出圈。而在行業內人士看來,這兩件事的核心意義在於,文心大模型做了兩道難度非常高的技術證明題,展示了大模型不是隻能紙上談兵,而是能夠應對真正的產業場景。
在以往的大模型測試中,所使用的基本是內容固定、方向單一的資料集。這種測試當然有一定價值,但卻與產業中需求多樣、資料樣本稀少、用時要求苛刻的環境有天壤之別。
比如說高考作文寫作就是這樣一個任務。高考作文比一般的文字生成任務更長,而且需要保證長文各個段落之間的邏輯性和連貫性。與此同時,寫作需要徹底理解並且緊扣主題,從而保證中心突出,確保所有資訊準確指向踩分點。這種真正考人,而不是考AI的任務,就是對大模型的一個巨大挑戰。在AI寫作高考作文中順利完成任務的,是百度使用了最新推出的文心·NLP大模型 ERNIE 3.0 Zeus。它就像個見多識廣的“尖子生”“學霸”,理解能力和創作能力比傳統模型更強。最終展現在我們面前的,就是一篇文辭華美、立意準確的高考作文。
再說說參加畢業畫展。我們知道,大模型的特徵之一就是不僅能夠處理自然語言處理任務,還在機器視覺、跨模態、知識圖譜等領域取得了巨大進展。度曉曉在美院畫展上創作的“無界”系列畫作,從不同角度詮釋了AI理解的“無界”,就展現出了文心大模型跨模態圖文生成模型ERNIE-ViLG,所具備的強大跨模態理解和生成能力。
跨模態理解資訊,生成內容,是人類智力的專屬價值,也是AI的核心努力方向。根據題目創作畫作,需要AI對給到的資訊進行深度理解,緊接著結合自身聯接的知識進行資訊擴充,進而闡述創作的靈感,最終再以跨模態生成的方式完成畫作。文心大模型的這一系列操作行雲流水,而且真正做到了資訊準確與藝術表現力的統一。這種智商與情商兼具的藝術家,其實才是最難得的。
這兩件出圈之舉,可以說是文心大模型回答的證明題:向業界證明了AI大模型不僅能夠堆引數,跑資料集。還能夠無差別參加那些只有人類才能參加的活動,並且給出不屬於人類的完成水準。我們已經不需要謹小慎微地給大模型出題了,廣闊天地,四海八方,或許都是AI可以參與一答的題目。
當然,寫作文與作畫背後,不僅是文心大模型的技術能力自證,同時也是AIGC產業方向的清晰標識。能夠寫文作畫的AI,當然也可以在更多內容生產中大展身手。比如AI寫歌、AI剪輯等等。
於是,剛剛放下答題紙和畫筆的文心大模型,就跑去寫了首歌,順道組了個CP。
再來看看“多選題”:和龔俊組CP展示出的應用價值
畢業季中,走向社會的年輕人不僅需要證明自己的能力,還需要選擇清楚自己的道路——大模型當然也是如此。
於是我們看到,大模型正在越來越多的崗位發光發熱,並且還是與明星一起。6月14日,度曉曉與龔俊數字人聯合演唱的《每分 每秒 每天》歌曲MV成功刷屏。這是國內首支從作詞到編曲都是由AI來完成的虛擬偶像單曲。
此外,度曉曉與龔俊數字人已經入駐百度APP。在使用者使用百度APP的時候,可以透過搜尋框或者底部的語音按鈕發起聊天類需求。比如使用者說“你好,你多大了,我想你了,我想聊天”,會直接進入搜尋負一樓的對話式框架。度曉曉&龔俊數字人會在負一樓陪伴使用者,進行具有深度的語音對話。
為了這份隨時隨地的陪伴,文心大模型提供了整合了多模態互動技術、機器翻譯、語音識別、自然語言理解等多項能力,從而實現了個性化聊天陪伴、輔助搜尋、服務分發和互動玩法四大功能為一體。在百度APP中,使用者可以直接透過個性化聊天來感受大模型的能力和魅力。文心大模型可以呈現出有上下文聯絡,自然生動的聊天互動,並且在對話中識別使用者是否有搜尋需求、服務類需求等進行輔助。而這背後,是全球首個生成式開放域對話大模型PLATO。
PLATO當然有著一系列技術差異性,但或許更重要的是,它清晰展示出了預訓練大模型如何與具體的應用場景、實際應用任務相結合。大模型的價值清晰展現在了對以往APP互動的超越上,透過開放域對話大模型,APP可以向使用者提供超越以往搜尋服務與語音助手服務的全新價值。其體驗更加接近與真人互動,並且比傳統的關鍵字搜尋會更加人性化、更有針對性,能夠更加準確理解使用者的需求。
大模型的應用價值,不在於能夠替代此前的某種技術。或者說不僅於此,而是可以做出“多選題”,整合多樣化的價值,應用於多樣化的產業需求。
在數字人生成、智慧客服、AIGC等等領域,可以看到文心大模型都有著真實且廣泛的產業級應用落地。
一起來做這道“開放題”:大模型剛剛畢業,卻已經走向百業
也許那邊的朋友要問了:這麼好的大模型,什麼時候才能體驗到呢?答案是,現在。
文心大模型已經是一道開放題,等待著千行百業的你來一起寫畫她的畢業作品。
舉個例子,上文提到的ERNIE 3.0 Zeus是文心大模型最新發布的融合任務相關知識的千億大模型,也是國內首個開放API呼叫的千億大模型。該模型在學習海量資料和知識的基礎上,進一步學習百餘種不同形式的任務知識,增強了模型的效果,在各類NLP任務上表現出了更強的零樣本和小樣本學習能力。而ERNIE 3.0 Zeus的智慧寫作功能目前已經上線暘谷社群,開發者可以即可體驗到這些前沿技術帶來的價值。
既很強,也很落地,或許可以被稱為文心大模型的畢業季口號。這背後是文心大模型的兩大核心特色:產業級和知識增強。
“知識增強”是文心大模型的核心技術差異,即透過引入知識圖譜,透過“知識增強”的方法,將資料與知識融合,使得文心大模型相較於其他模型,學習效率更高、可解釋性更好。這是文心大模型能夠超越眾多“同學”,率先走向就業的技術保障。
而“產業級”則是百度在大模型落地領域的經驗、技術、產品設計與生態培養等等能力的融合。一方面,文心大模型的技術來源於產業,從設計與技術上就傾向產業應用;另一方面,文心大模型建設了一系列配套能力和工具,透過多種方式降低大模型應用門檻,提升其真實應用的可行性。
在這兩大特性的保證下,百度在全球範圍內開啟了一場讓大模型走向產業的“畢業旅行”。寫高考作文,畫畢業作品,與明星一同寫歌,都可以看作這場旅行中的一些風景。在更廣闊的產業原野上,百度還將文心大模型不斷升級,瞄準各行業的智慧化需求。不久之前的WAVE SUMMIT 2022深度學習開發者峰會上,文心大模型迎來一系列升級:釋出10個新的大模型,同時提出了基礎大模型、任務大模型、行業大模型構成的三級體系。讓不同的應用場景、行業需求有不同的大模型支撐,真正讓大模型走向千行百業。與此同時,考慮到開發者、應用者不同的使用需求和開發能力,百度還圍繞文心大模型提出了一系列產業落地的關鍵路徑,比如建設更適配場景需求的大模型體系,提供全流程支援應用落地的工具、平臺和方法,建設激發創新的開放生態等。為促進大模型惠及最廣泛的行業與開發者,配套釋出大模型套件、API體系,以及暘谷大模型創意社群,全方位幫助開發者更低門檻地應用。
如今,智慧作畫、智慧對話、智慧創作、故事生成等大模型創意應用已經上線暘谷社群。百度與國家電網、浦發銀行等行業頭部企業進行了聯合研發與創新,成功實現了行業大模型在產業中落地生根。
從應用深度上看,在百度內部文心大模型也全面應用於智慧搜尋、資訊流、智慧音響等網際網路產品,大幅提升了使用者獲取資訊、知識和服務的效率和體驗。在百度之外,文心大模型的落地應用已經覆蓋工業、能源、教育、金融、通訊、媒體等眾多行業,例如工業領域的零部件質量檢測、能源領域的輸電線路巡檢、金融行業的合同資訊抽取等等,幫助企業實現智慧化升級。
百度業務中看得到,產業應用裡用得到,開發者找得到,讓文心大模型做成了一道開放題。它的答案,是人人都能成為大模型開發者,行行都能成為大模型應用者。
《經濟學人》最近發了一篇關於大模型的文章,其中提到文心ERNIE大模型是中國最好的預訓練大模型。就我的理解,文心大模型好就好在它的“真”。
真實的解決技術難題,而不是用多少億的引數,百分之九十九點多少的分數來證明自己。
真誠不套路的去用,去證明自己的價值。而不是畫餅充飢,用PPT展示未來。
真正地融入產業,融入需求,賦能開發,築造生態。
或許,每個人在校園裡都許下過改變世界的夢想。後來有人真正實現了,有人沒有。
差別可能就在於畢業季到來的那天,我們選了什麼,做了什麼。
致用,務實,本分,這才是大模型的花樣畢業季。
來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/31561483/viewspace-2901055/,如需轉載,請註明出處,否則將追究法律責任。
相關文章
- 開年大動作頻頻,百度大腦謀局2019釋放出什麼AI行業訊號?AI行業
- 畢業季,我的Linux求職之路Linux求職
- 大模型走向產業的一小步,AI走向普惠的一大步大模型產業AI
- 頻頻刷屏朋友圈,白酒如何越來越年輕化?來聊聊白酒企業數字化
- 哪些行業需要大頻寬伺服器呢?行業伺服器
- “百年老店”任天堂:頻頻出圈的啟示錄
- 企業應該如何選擇大頻寬伺服器伺服器
- 面向企業網路的九大頻寬監控工具詳解
- 360信創領域動作頻頻 信創產業落地再提速產業
- 黃埔學院畢業季,也是中國產業AI的開學禮產業AI
- 大寬頻fwq的優勢
- 史上最難就業季,應屆畢業生找工作路在何方?就業
- 跨國企業頻繁併購,SAP諮詢行業的非常利好行業
- 業界首發行業大模型,提出落地3大關鍵路徑,百度的大模型原來是這麼用的行業大模型
- 中南民族大學舉行2020畢業典禮,6000多名畢業生通過企業微信“雲畢業”
- win10企業版cpu頻率在哪設定_win10企業版cpu頻率怎麼設定Win10
- 迴圈遍歷中幾個高頻使用的方法
- 破局|醫療行業重大網路攻擊事件頻發,如何解決?附解決方案行業事件
- 頻頻落子 Aruba的“智慧邊緣”棋局
- 什麼是大頻寬伺服器?大頻寬伺服器的優勢有哪些?伺服器
- CPU睿頻和超頻的區別 睿頻是什麼意思
- 又是一年畢業季——程式設計師的苦與樂程式設計師
- B站商業化探索頻頻:品牌方如何佈局“小破站”營銷(附下載)
- 大頻寬伺服器的優勢伺服器
- 利聯科技:香港大頻寬伺服器能否支援影片行業呢?伺服器行業
- GitHub 官方大動作頻頻「GitHub 熱點速覽 v.22.24」Github
- cpu超頻和不超頻的區別是什麼 cpu超頻和不超頻哪個好
- 前端效能:股票交易APP頻繁更新怎麼破前端APP
- 一個平凡軟體測試人的故事——畢業季獻給青春
- 通訊圈周盤點:全球寬頻價格的可承受性降低;華為釋出企業業務2021年年報
- 貝殼研究院:2021年畢業季居住洞察報告
- 又是一年畢業季——如何入坑程式設計師程式設計師
- 為IMT業務尋找下一個核心頻段
- 小米8雙頻GPS評測 雙頻GPS和單頻GPS定位的區別
- 真實原件購買《南澳大學畢業證》一模一樣畢業版本
- 紐約聯儲:大學畢業生的平均年薪較高中畢業生多出3萬美元
- 2020畢業生就業大資料:IT行業平均薪資7839元就業大資料行業
- 大學畢業學什麼專業好就業?當然IT咯就業