如今,學習辦公、家庭教育和兼職賺錢三大場景的內容創作,用 AI 重構的百度文庫能全搞定了。
大語言模型發展至今,對各行各業的賦能程度越來越深,一些代表性產品正在改變甚至顛覆著整個行業。簡單回顧便能發現,ChatGPT 引領了一場文字創作革命、Stable Diffusion 等文生圖大模型降低了繪畫門檻、影片大模型 Sora 令影視從業者感到恐慌、音樂大模型 Suno 引發了一場音樂圈地震…… 我們能夠感受到 AI 大模型重塑內容創作行業尤其是跨模態生成的巨大潛力。如今,AI 大模型能力的釋放,不僅可以將使用者需求轉化為成熟產品,也能讓經典產品展現出前所未有的活力。在 5 月 30 日舉行的 2024 百度移動生態永珍大會上,我們從百度搜尋、百度文庫、百度 APP 等產品基於文心大模型釋出的各項行業領先新功能中,看到了全新的產品形態。本屆永珍大會還是國內首個智慧體生態大會,百度希望更多使用者、創作者和生態夥伴加入並共同構建低門檻、多場景、高價值的智慧體生態圈,探索智慧體賦能產品、場景和行業的新思路。 百度集團資深副總裁、百度移動生態事業群組總經理何俊傑。
面向內容創作領域,已上線上百項多模態 AI 功能的百度文庫,讓智慧創作時代正在到來。比如智慧畫本功能,使用者只需要輸入一句話主題,幾分鐘內就能自動生成圖文並茂、人聲朗讀的影片畫本。這些全新內容創作體驗早在 2023 年 8 月,百度文庫宣佈基於大模型全面重構為「一站式 AI 內容獲取和創作平臺」時便埋下了種子。自那時起,百度文庫開始了蛻變之路。正如百度集團資深副總裁、百度移動生態事業群組總經理何俊傑會上所言,「百度文庫既是陪伴了使用者已經 15 年的老朋友,也成為被大模型重構的新物種。」現在,從內容獲取、到創作編輯、到商業變現,百度文庫作為一站式平臺為不同群體、不同場景提供了針對性的 AI 功能和服務,在學習辦公、家庭教育、兼職賺錢三大使用場景,為使用者帶來了更智慧、便捷的創作途徑與體驗。AI 大模型對產品的重構要有指向性,把握產品自身的定位和使用者群體,瞭解主要使用場景和任務需求,才能做到有的放矢,實現產品新功能與使用者方方面面的匹配。因此,百度文庫的重構從一開始便要找準努力的方向,著眼於解決使用者群體在當前內容獲取和創作層面的主要需求。在產品定位上,百度文庫從以往單一的內容查閱平臺,升級到了一站式 AI 內容獲取和創作平臺。對於學習和辦公場景來說,這些功能帶來的幫助尤為明顯。大會上,百度副總裁、文庫事業部負責人王穎表示,「理想的 AI,應該端到端解決問題,讓機器像人一樣思考,讓產品像人一樣工作。這些,大模型重構後的百度文庫都做到了。它將成為大家全天候的智慧夥伴,讓使用者真正實現查閱無憂,創作自由。」對於很多打工族、大學生來講,百度文庫已經從「內容工具」變成了「生產力工具」,智慧 PPT 生成、文件生成、思維導圖生成、研究報告生成、全場景指令編輯等 AI 功能,在專業文件和資料查詢之外實現智慧、高效、便捷創作。我們以移動端智慧 PPT 生成功能為例,它支援輸入主題、上傳文件和拍照生成 PPT。下面選擇了輸入主題來生成 PPT,對話介面可以手動和語音輸入,從寫大綱到自動生成一份內容翔實、配圖豐富、邏輯縝密的完整 PPT,幾十秒內便能完成。此外,該功能支援 PPT 線上調整編輯、PPT 內生成專業圖表、一鍵更換 PPT 設計風格、字型字號等,還能一鍵生成對應的演講稿和思維導圖。我們瞭解到,百度文庫在行業內率先實現了多格式、多文件生成以及編輯全能力打通。接著就是智慧研究報告功能,這可能是文件型別中最難的任務了。我們提出需求「幫我寫一份 2023 年 AI 大模型發展的研究報告」,幾分鐘內便生成了一份 12000 多字的研究報告。對於需要改進的部分,直接呼叫 AI 編輯功能進行潤色、擴寫和續寫即可。在生成研究報告的基礎上,同樣可以繼續自動生成對應 PPT。一番體驗下來,最大的感受是,在這些 AI 功能的加持下,百度文庫已經成為學習辦公神器,解決了使用者跨平臺、起筆難、編輯難一系列問題。並且,很多 AI 功能之間實現了打通,如 PPT 轉思維導圖、研究報告轉 PPT,便捷性很強。當然,百度文庫非常注重生成內容的質量。就拿智慧研究報告來說,它得到了專業頂級諮詢機構羅蘭貝格全球合夥人李冰的認可,「用了一下百度文庫的AI研報功能,很超預期,生成報告的框架清晰、邏輯嚴謹,資料庫支援權威,感覺已經像有一定經驗的諮詢顧問寫出來的東西了。」百度文庫在學習辦公場景帶來了質的提升,無論是生成速度,還是多工執行能力,極大提升了創作效率,節省了時間。除了持續賦能學習辦公場景之外,百度文庫近來開始全面發力跨模態內容創作,有了一系列動作。5 月,百度文庫行業首發智慧畫本功能,首創圖文聲並茂 AI 影片畫本創作能力,對使用者全面開放。在家庭教育場景中,沒有繪畫功底的父母現在可以透過智慧畫本創作功能進行專屬故事創作,還能將孩子腦海中天馬行空、稀奇古怪的想法具象化描繪出來,一舉多得。使用者只需輸入一句話主題,剩下的一切交給 AI。我們以「端午節為什麼要吃粽子」為主題來創作畫本。百度文庫會根據自身對該主題的理解生成一份畫本大綱,然後選擇畫本風格,這裡使用了卡通風。接下來只需等待三到五分鐘,就能完成畫本創作。整個生成過程中,經過特殊的模型處理和訓練,前後畫風、物件關係都能保持一致。如果對生成的一些圖片不滿意,還可以重新生成。文字描述也支援重新編輯,對使用者很友好。最後播放「影片畫本」,透過手動或自動翻頁效果和童聲朗讀,更能吸引孩子。加入智慧畫本功能之後,百度文庫變得更有溫度,為親子之間提供趣味更強、更能投入其中的溝通與互動媒介,增進感情。這樣一來,既能幫助父母低門檻地實現對孩子的常識教育,也能激發孩子的想象力,培養他們的閱讀興趣,寓教於樂。此外,為了向使用者提供更加豐富的畫本創作體驗,百度文庫還與國內頭部 IP 進行內容合作。比如,百度文庫宣佈與「豬豬俠」IP 達成戰略合作,行業首創「3D 風格 AI 畫本」創作功能,豬豬俠 IP 也正式入駐百度文庫。後續使用者可以選擇豬豬俠形象進行智慧畫本自由創作,讓經典動畫 IP 形象透過智慧畫本功能傳播更廣。現如今,藉助 AI 大模型的文字和跨模態生成能力,普通人也能產出不錯的作品,並在不同的內容平臺透過寫文章或畫畫賺錢。百度文庫也在這方面下了功夫,透過智慧漫畫、智慧小說等跨模態 AI 創作功能,幫助人們更容易地將創作內容商業變現,成為兼職賺錢的好幫手。先來看智慧漫畫生成功能,它在行業內率先打通了 AI 漫畫創作全鏈路,多場景和多人物處理、人物一致性、故事完整性都實現了行業領先。重要的是,漫畫這一專業性很強的內容創作型別讓小白也能觸手可及了。像智慧畫本一樣,智慧漫畫的生成也很簡單。下面以「周處除三害」為主題創作漫畫,AI 會先自動創作出一篇與主題相關的完整故事,然後生成符合故事劇情的漫畫分鏡。最後自動生成完整的漫畫作品,整個過程同樣在幾分鐘內搞定。如果畫面不符合預期,還可以區域性調整和修改。透過重新編輯畫面對應的文字描述,讓 AI 精調出更符合需求的畫面。百度文庫表示,生成的漫畫作品基本可以做到「直接可用」。因此,這些作品可以投到第三方漫畫平臺賺錢。同時,百度文庫還宣佈與《秦時明月》背後製作團隊「玄機科技」達成戰略合作,在跨模態技術和內容上進行共創,為 AI 漫畫創作者提供流量扶持等激勵措施,擴充變現渠道。除了畫漫畫賺錢之外,我們更經常聽到的是「兼職寫小說賺了多少錢」的報導。小說創作已經成為兼職行業的前三選擇,但同樣存在門檻,即便能寫也不一定能寫好,成為爆款並掙錢就更難了。智慧小說生成功能可以幫助創作和編輯長篇小說,提升小說內容的產出效率和質量,讓小白使用者也能輕鬆創作出劇情連貫、角色吸睛、扣人心絃的小說。過程中,使用者透過設定標籤、隨機標籤、生成大綱,然後生成小說片段。完成之後還支援一鍵續寫,進一步豐富小說內容。生成小說的質量也得到了肯定。據介紹,有小說愛好者使用百度文庫創作的小說,在釋出到小說平臺後很快收穫上萬點贊,並開始賺錢了。百度文庫也與喜馬拉雅達成戰略合作,聯合推出「AI 短故事短劇寫作課」,為喜馬拉雅平臺上千萬創作者提供智慧文件、智慧小說、智慧漫畫等一系列 AI 創作服務,使用者還可以透過百度文庫、百度小說等平臺進行分發和變現。我們看到,百度文庫正在向人們釋放了這樣一種訊號:無論是文字、跨模態的內容創作還是想靠 AI 創作來賺錢,如今都能依靠一個個「可用、可信、可靠」的智慧助理。也因此,百度文庫的 AI 功能深受使用者喜愛和好評。截至目前,累計 AI 使用者已超 1.4 億,AI 新功能使用次數超 15 億,還在最新一期 AI 產品榜中位列國內總榜第一名。文心大模型的全面重構,讓百度文庫獲得「新生」的同時,更讓使用者體驗有了脫胎換骨的變化,自然能夠獲得青睞。百度文庫內建的各項 AI 能力都瞄準了一個個垂類場景,已經足以滿足使用者的多樣化內容檢索、總結與問答、跨模態創作需求。在大會上,百度文庫針對更加深層次的科研、學術需求,又推出了全新的 AI 原生應用。該應用名為「橙篇」,它在 PC 網頁和 PC 客戶端推出,是行業首個集專業知識檢索和問答、超長圖文理解和生成、深度編輯、跨模態自由創作的綜合性 AI Native 產品,顯然又是一個「多面手」。PC 網頁端的「橙篇」介面如下所示:
透過呼叫背後百度文庫、百度學術以及全網數十億的專業資訊和文獻資料,使用者首先可以在「橙篇」上進行學術搜尋和 AI 全網智慧檢索。 學術搜尋。
全網搜尋。
在實際操作中,找到很多相關、不同型別的資料後,使用者再進行粗讀整理是一個複雜、漫長的過程。「橙篇」則具備了行業領先的超長文件理解能力,使用者可以進行超大量、超多格式、超長內容文件的理解、總結與問答,最多可以輸入 100 個不同格式檔案,包括 PDF、Word、圖片、連結等。在超長圖文生成上,「橙篇」行業率先上線超長篇專業長文生成能力,並提供「輸入主題生成」 和「參考範文寫作」兩種長文寫作方式。使用者輸入一句話主題或上傳範文,AI 將自動理解並快速生成超長篇專業長文。
同時可以對任意模組上傳指定材料重新生成編輯,比如實驗方法、實驗資料、統計結果、實驗分析等專業內容,大模型將進行學習並迭代到長文內容中,還能自動生成專業圖表。
之後,使用者還可以進行深度編輯和整理,不僅能夠潤色、擴寫續寫、還提供一鍵全文校正、使用者指定模版整理全文格式、參考源梳理和生成、智慧編輯等功能。
在專業文字創作之外,「橙篇」未來也將上線跨模態內容創作能力,包括 AI 思維導圖、AI 漫畫、AI 有聲畫本等。透過各項 AI 原生能力,「橙篇」將為創作者提供更自由、便捷和沉浸式的服務。此外,「橙篇」還將進一步改變人們對內容創作的傳統認知,檢索、生成、編輯、整理多位一體,省去了在不同軟體之間來回切換的麻煩,更能體驗到一站式 AI 創作能力。當下,大模型之間的競爭焦點正在發生改變:逐漸從上半場的規模效能比拼,向下半場的垂直應用、商業落地、生態構建等層面轉進。當重複造輪子的百模大戰走到頭時,整個行業的轉向勢在必行。百度文心大模型對包括百度文庫在內所有產品的重構是這一趨勢的真實寫照,不再只看模型引數突破等「硬」實力,轉而更加重視能否精準契合使用者需求、模型面對任務時能不能解決好、執行過程是否自然友好,這些「軟」實力變得越來越關鍵。尤其是在學習工作、家庭教育、兼職賺錢這些與普通人聯絡緊密的場景中,大模型賦能的 AI 能力感知最強。而擁有海量使用者的百度文庫憑藉豐富的內容創作場景,為 AI 功能提供了天然的試煉場。百度文庫在基於文心大模型重構時,執行環節藉助混合專家模型(MoE)和檢索增強生成(RAG),合理分配和呼叫多個不同尺寸模型,實現跨模態、跨格式內容生成,還能把生產的內容自動化組裝成使用者所需的最終可用成品,真正實現一鍵獲取。同時,面向創作場景和功能時更聚焦,在設計與開發過程中端到端地解決問題。這樣做的效果也很明顯,百度文庫成為了 AI 重構最徹底的產品,潛移默化地改變著人們的學習、辦公和創作習慣,讓人人都可以體驗漫畫、小說等專業性很強的內容創作,整個行業的准入門檻變低了。全方位 AI 能力加身的百度文庫也越來越具備「超級應用」的雛形。有訊息透露,文心大模型 5.0 將於明年釋出。很多人猜測,5.0 版本將發力多模態,在文字、影像之外,將逐步實現與影片、音訊、程式碼等更多形式的互生轉換,這也許將為百度文庫提供更全面的能力支援。未來,百度文庫的 AI 功能有望覆蓋更豐富的內容創作形態,文生影片也許將以更強大的面貌出現。可以預見,隨著百度文庫 AI 功能持續豐富和增強,內容創作領域會加速進入 Next Level —— 任何人都能勝任,什麼任務都能搞定。