大模型的禾下乘涼夢,百度自己來做試驗田

naojiti發表於2022-09-27

禾下乘涼夢,是一個今天國人無比熟悉的詞。它來自袁隆平院士對雜交水稻高產的理想追求,是袁隆平的中國夢。他生前多次提到,夢想到禾下乘涼,夢裡水稻長得有高粱那麼高,籽粒有花生米那麼大。

或許,千行百業都有這樣一個“禾下乘涼夢”。科技探索會為生產與創造帶來難以估量的價值,極大改變人們的生活。在AI領域,有一項技術經常讓我聯想到“禾下乘涼夢”,那就是預訓練大模型。在袁隆平院士的夢中,雜交水稻會長得非常高大,帶來極高的畝產量;大模型也是在訓練資料與模型規模上非常大,在模型能力上形成巨大優勢。

從2018年開始,大模型開始作為AI領域重要的技術方向被廣泛關注。多年過去,我們對於大模型最大的期待,或許就在於它能不能從實驗室和資料集中的“種子”,真正變成一片片賦能行業,普惠經濟的稻田。

雜交水稻的發展,離不開精心耕耘的試驗田。實現大模型的“禾下乘涼夢”,或許也需要這樣的“試驗田”挺身而出,為時代探明大模型的前進方向——這個關頭,百度站了出來。

9月23日,2022永珍·百度移動生態大會在廣東珠海召開。會上,百度集團資深副總裁、百度移動生態事業群組(MEG)總經理何俊傑首次對外全面解讀百度移動生態戰略。其中非常值得注意的一點,是會上詳細展示了我們熟悉的百度移動生態,是如何與百度打造的文心繫列大模型深度結合,帶來搜尋、資訊流、AIGC等領域的禾木生長。在百度移動生態中,文心大模型的能力可謂能用盡用,應出盡出。

換個角度想,如果我們想知道未來千行百業如何在大模型的禾下乘涼,那麼今天百度移動生態的場景座標,或許正指向著明天智慧中國的大模型之路。

大模型3.0階段,產業轉化成為核心

在討論百度移動生態融合文心大模型能力的重要性之前,我們必須先來了解這背後的技術與產業背景。百度移動生態與大模型融合之所以重要,是因為大模型這項技術本身正處在非常重要的發展節點。

從發展歷程上看,從2018年預訓練大模型開始受到行業重視算起,大模型的發展可以歸納為三個階段。第一階段就是所謂的“大煉模型”。傳統的深度模型已經是行業主旋律,而預訓練大模型作為一種新興的技術思路,開始進入萌芽階段。接下來在第二階段,大模型的價值得到了產學各界的普遍認同。伴隨著資本與社會關注度的廣泛注入,談AI必談大模型成為風尚,各界也就進入從“大煉模型”到“煉大模型”的轉變。在這個階段中,各種大模型層出不窮,在訓練資料引數上的擴張,技術思路的發展帶來了大模型技術的繁榮。

當大模型的技術研發儲備到一定階段,新的挑戰也隨之而來:這麼多大模型,到底應該如何與產業應用結合?這個問題如果不能妥善解決,那麼大模型的繁榮發展終究是空中樓閣。所以,大模型的3.0階段,就是從“煉大模型”到“用大模型”的轉變。如何實現有效的產業轉化,已經變成了目前階段大模型領域的最核心任務。

想要用好大模型,從技術向產業的轉化邏輯上看,需要具備三個前提條件:技術過硬,平臺與工具齊備,有清晰明確的場景價值作為示範。而一路深耕文心繫列大模型的百度,顯然在前兩項能力中具備先發優勢。

百度自2019年開始深耕預訓練模型研發,釋出了知識增強文心ERNIE系列模型。2021年12月,百度與鵬城實驗室聯合釋出全球首個知識增強千億大模型“鵬城-百度·文心”,引數規模達到2600億,在60多項NLP任務中取得最好效果。2022年5月的Wave Summit深度學習開發者峰會上,百度釋出10個大模型,包括融合學習任務知識的知識增強千億大模型、多工統一學習的視覺大模型、跨模態大模型、生物計算大模型、行業大模型等,並提出支撐大模型產業落地的3個關鍵路徑:建設更適配場景需求的大模型體系,提供全流程支援應用落地的工具、平臺和方法,建設激發創新的開放生態等。

至此,文心大模型已經既包含基礎的通用大模型,也包含面向重點任務領域的行業大模型,同時還具備豐富的工具平臺。從技術過硬角度看,文心大模型具有知識增強的差異化優勢,可以從大規模知識圖譜和海量無結構資料中完成學習,從而實現模型效率更高、效果更好,具有良好的可解釋性。從平臺建設與產業轉化上看,文心大模型具有產業級特性,提供全流程支援應用落地的工具和方法,營造激發創新的開放生態。

換言之,清晰的場景化示範價值,是文心大模型推動大模型走向3.0階段的“最後一公里”。這個時候,百度豐富的產業生態佈局,就體現出了關鍵價值。

百度移動生態,做大模型時代的“試驗田”

在科技領域有句話,叫“自己的降落傘自己先跳”。對於希望率先探索大模型應用與產業轉化的百度來說,也必須“自己的大模型自己先用”。

好在百度豐富的移動生態佈局,不僅是大模型應用的價值沃土,更能以其苛刻的技術要求、清晰的能力展現、具有代表性的應用場景,成為更多開發者與企業的大模型“試驗田”。

2022永珍·百度移動生態大會中,我們看到了百度移動生態與文心大模型基礎能力豐富多元的融合。百度移動生態,向來是百度AI技術落地的“首站”,長期秉持著AI技術能用盡用、能出盡出的原則。

而在與大模型的結合上,我們首先可以看到百度最新發布了面向搜尋場景的跨模態大模型“知一”。它可以理解全網文字、圖片、影片、結構化資訊等形態各異的資源,從而打破資源形態的界限,將最滿足使用者需求的結果呈現給使用者,真正實現大模型技術與搜尋、資訊流等百度核心業務的深度融合。

而對於更多百度移動生態中的開發者、創作者而言,基於文心大模型打造的“創作者AI助理團”可以帶來劃時代的AIGC體驗。這個AI團隊裡,有文案、有插畫師、有影片製作人,在這些“助理”們的齊心努力下,可以讓創作者實現“一個人成為一支隊伍”。

基於百度文心大模型,“AI文案助理”可以根據創作者的需求快速產出不同風格的文章標題、內容段落,“AI插畫助理”可以根據關鍵詞,自動“畫”出十餘種不同風格的畫作,讓創作者實現“配圖自由”。相關能力,目前已經可以在百度APP中體驗,效果十分突出。

“AI影片製作助理”基於文心大模型的自然語言處理和跨模態AI技術,讓創作者的圖文自動生成影片,速度可達“分鐘級”。這項技術讓創作者從圖文到影片的創作週期縮短了3倍以上,而且也為創作者帶來“一篇內容,兩種收益”的效果。

“創作者AI助理團”,可說是全景式展現了大模型的一個應用價值——AIGC(AI Generated Content,人工智慧自動生成內容)。基於大模型打造的AIGC能力,可以實現多種多樣的AI自主創作,以及形態豐富的創作輔助功能,實現自動生產文案、自動生產圖片、圖文轉影片等一系列技術飛躍。目前,“創作者AI助理團”已經開始邀請內測,將從今年第四季度起陸續向更多創作者開放。

由此我們不難看出,文心大模型帶給百度移動生態的能力並不是“錦上添花”的簡單能力升級,而是實打實的跨越式創新,甚至可以說解決了移動開發者、創作者長期以來最核心的創作門檻困擾,讓創作者聚焦於創作的最核心部分。

這樣的能力升級,當然對於百度移動生態的未來發展至關重要。但更重要的,可能是這種結合展示了一種可能,一種大模型走向深度產業應用的可能。

AIGC豐收時,行業轉化深耕中:文心大模型的禾下乘涼夢

不久之前,科技部發布了《關於支援建設新一代人工智慧示範應用場景的通知》(以下簡稱《通知》),指出要充分發揮人工智慧賦能經濟社會發展的作用,打造形成一批可複製、可推廣的標杆型示範應用場景。

不難看出,以場景作為先導,快速實現AI技術的行業落地與規模化輔助正在成為目前AI產業發展的主要任務。對於大模型來說也是如此,各行業想要真正理解大模型的價值,應用大模型的能力,首先需要以場景為先導,以示範為座標。

百度移動生態對於大模型的深入應用,正好可以構成這種迫切為時代所需要的場景示範。從大模型走向產業轉化的路徑上看,百度移動首先證明了AIGC的可用性。AIGC作為大模型走向產業的重要一站,更多行業可以從百度的經驗中消化並吸納AIGC的價值,從而實現自身的大模型落地。其次,百度移動生態與大模型融合,還證明了大模型與產業需求、產業真實情況的融合價值。百度移動生態擁有著巨大的流量以及多樣化的業務,這些條件都是對大模型可用性的考驗。

知名經濟學家任澤平也在永珍大會期間表示:“在AIGC的時代,百度APP作為‘前哨’和‘根據地’,是AIGC應用最廣闊的天地,也將成為人人皆可用的AI新基建。這種‘百度搭臺,人人唱戲’的模式,將會激發全民更大的創造力,很多新模式、新應用都會破土而出。”

從文心大模型與百度移動生態的結合,到AIGC產業實踐的探索,再到更多行業應用大模型的可能,我們可以看到這個路徑為大模型的3.0階段帶來了三重價值。

1.自種自證:大模型的技術能力已經趨向飽滿

百度移動生態對文心大模型的應用,首先讓各行業的開發者看到了大模型能做什麼,有著怎樣的想象力,而這歸其根本來自文心大模型的技術能力。大模型的種子,需要在土壤中證明自己的價值,而AIGC與百度移動生態就提供了這樣的土壤。以AI智慧寫作為例, ERNIE 3.0 Zeus是文心大模型最新發布的融合任務相關知識的千億大模型,其在學習海量資料和知識的基礎上,進一步學習百餘種不同形式的任務知識,在各類任務表現出了更強的創作能力。從財經、體育類新聞快訊,再到詩歌、小說等文學創作,AI寫作覆蓋的領域越來越廣,創作形式和內容也變得更加豐富多彩。

今年高考期間,ERNIE 3.0 Zeus 加持的AI數字人度曉曉挑戰寫高考作文,以40秒40篇的速度,獲得了位列總考生前25%的成績。 ERNIE 3.0 Zeus的智慧創作能力目前已經對外開放,各行各業的廣大開發者可以線上體驗與定製ERNIE 3.0 Zeus的文字創作能力。再說說AI作畫,AI作畫這樣的AIGC應用想要得到保障,背後是文心跨模態大模型的有力支撐,作為全球最大中文跨模態生成模型,文心ERNIE-ViLG引數規模已達100億,它將「文生成圖」和「圖生成文」任務融合到同一個模型進行端到端學習,從而增強文字和影像的跨模態語義對齊。而近期文心ERNIE-ViLG文圖生成演算法迎來升級,透過漸進式擴散模型,生成空間由小及大、生成輪廓由粗到細,同時根據生成階段自動選擇最優生成網路,文字生成影像的效果取得進一步提升。可以說,每一幅AI畫作的背後,都有文心大模型技術能力飽滿的證明。

2.沃土通衢:產業工具與開發平臺逐漸完備

各行業、各領域中的開發者,想要真正用到大模型,就需要針對性的平臺與工具,從而降低技術獲取門檻,提升產業開發效率。為此,文心大模型在工具化、平臺化中進行了豐富的探索。以AI作畫為例,文心一格是百度推出的AI藝術和創意輔助平臺,是百度依託于飛槳、文心大模型持續的技術創新,在“AI作圖”方面釋出的產品。面向有設計需求和創意的人群,文心一格可以基於文心大模型智慧生成多樣化AI創意圖片,輔助創意設計,打破創意瓶頸。對便捷性需求更高的開發者,還可以使用文心文圖生成大模型ERNIE-ViLG 服務,極速獲得沉浸式文圖生成大模型的技術體驗,更可靈活方便、高效地實現產品整合。這樣我們可以看到,對AI作畫有不同需求、不同考量的開發者,都有平臺和工具來獲取自己想要的AIGC能力。這就是大模型走向行業,走向應用的沃土通衢。

3.禾下乘涼:大模型規模化應用的開始

面向更廣闊的行業應用前景與產業想象力,文心大模型不僅僅推動與百度業務的結合,更積極探索對外賦能的形式與方法。文心大模型具備的知識增強特性,本身就可以實現在實體問答、知識預測等領域獲得更好效果,提升大模型在行業場景中的可用性。同時,文心·行業大模型採用行業知識增強技術對行業特色資料與行業特色知識學習,進而提升大模型對行業應用的適配性。目前文心已經聯合國家電網、浦發銀行釋出知識增強的電力行業NLP大模型“國網-百度·文心”、金融行業NLP大模型“浦發-百度·文心”,已在電力、金融相關任務完成落地應用。在航天領域,文心大模型攜手中國航天釋出世界上首個航天大模型——“航天-百度·文心大模型”,推進航天領域AI技術應用。

文心大模型早已推出了開發套件、API和內建文心大模型能力的開發平臺,可以讓不同領域、不同需求的產業開發者以更低成本、更低門檻精準獲得大模型賦能,促進人工智慧的進一步廣泛應用。

文心大模型在產業中加速落地,正在成為推動AIGC發展的新引擎,同時也在成為推動產業智慧化的新基座。大模型的規模化應用和落地千行百業,或許就是我們期待的那個智慧中國的禾下乘涼夢。

來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/31561483/viewspace-2916472/,如需轉載,請註明出處,否則將追究法律責任。

相關文章