兩年前,在美國科羅拉多州博覽會藝術比賽上,一幅名為《太空歌劇院》的作品拿了第一名。
此畫氣勢恢弘、明暗有致,頗有法國象徵主義畫家古斯塔夫・莫羅的味道。只不過,它不是人畫的,而是由一位沒有任何繪畫基礎的參賽者,藉助 AI 繪圖工具完成的。
我們再把時間撥回到 2018 年。彼時,一幅名為《埃德蒙・貝拉米畫像》的 AI 畫作在紐約佳士得拍賣行,拍出了 40 多萬美元的高價。這是第一幅被拍賣的人工智慧作品,由此也標誌著 AI 藝術作品開始被市場認可。
如今,AI 繪畫早已司空見慣,國內外的 AI 玩家紛紛下場,都要把這一賽道卷冒煙了。
比如國外赫赫有名的 AI 生圖應用 Midjourney、Stable Diffusion、DALL-E,動不動就上演神仙打架;國內的位元組、阿里、騰訊等企業也隔三差五推出新產品、新功能。
可是,AI 繪畫應用五花八門,對於 AI 愛好者來說,如何實現更強的圖文匹配?如何生成更具美感的影像?如何高效部署文生圖模型呢?
《AIGC 體驗派》第六期節目就來嘮嘮這件事兒。
《AIGC 體驗派》影片節目由火山引擎、NVIDIA 聯手機器之心和 CMO CLUB 共同推出,匯聚了眾多營銷領域的專業人士,共同探討 AIGC 技術的應用、思考與實踐。
在本期節目中,兩位行業資深嘉賓將深入剖析高美感文生圖背後的技術鏈路,手把手教大家如何實現更強的圖文匹配。
直播時間:8月6日 19:00-19:40
直播主題:奇幻成像,高美感文生圖背後的技術鏈路
第六期節目邀請到兩位重磅嘉賓,分別是豆包文生圖技術專家張亮、NVIDIA 解決方案架構師趙一嘉。
精彩內容搶先看
使用者只需輸入幾句簡單的提示詞,AI 就能自動生成逼真細膩的畫作。無論是古典油畫的細膩質感,還是現代抽象藝術的自由表達,抑或是東方水墨畫的深遠意境,它都能遊刃有餘地進行創作。它不僅能學習和模仿歷史上著名畫家的風格,也能創造出全新的藝術流派,為使用者帶來前所未有的創作和互動體驗。
時至今日,AI 繪畫更是進化「成精」,甚至到了真假難辨的地步。
例如,這樣的:
或者這樣的:
也正是由於獨特的創作力和沉浸式的互動體驗,AI 文生圖成了各大 AI 廠商競相爭奪的「香餑餑」。
例如,位元組一口氣推出了剪映、星繪、即夢等 AI 產品,無一例外,它們都包含了文生圖能力,而這些產品的背後,都離不開位元組的豆包文生圖大模型。
對於文生圖模型來說,要想討得使用者「歡心」,無外乎三點:更強的圖文匹配、更美的影像效果和更快的生成體驗。
那麼,豆包文生圖大模型是如何實現更強的圖文匹配來滿足使用者的想法設計?如何生成更具美感的影像來提供更極致的使用者體驗?如何更快速地出圖來滿足超大規模的服務呼叫?
這些問題的答案,將在第六期《AIGC 體驗派》中揭曉。
8月6日晚7點,來直播間圍觀「奇幻成像,高美感文生圖背後的技術鏈路」,掃碼直達直播間。
上期回顧
在第五期《AIGC 體驗派》的直播中,火山引擎內容安全與風控負責人張建洋、NVIDIA 企業級開發者社群高階經理何琨深入剖析 AIGC 在營銷領域的創新與安全問題,分享如何在變革中實現業務的持續增長與穩健發展。
眾所周知,AIGC 技術正逐漸成為企業營銷一大創新利器。它可以幫助營銷人以前所未有的速度創作天馬行空的營銷素材,只需簡單輸入幾個關鍵詞或提示詞,就可以在短時間內自動生成引人入勝的營銷文案、圖片、以及營銷影片。
然而,正如任何技術革新一樣,AIGC 在提升營銷創意和效率的同時,也帶來了諸多安全問題。
火山引擎內容安全與風控負責人張建洋以實際案例,展示了火山引擎的 AI 技術如何為營銷人「保駕護航」。
張建洋表示,大模型的幻覺讓輸出結果不完全可控,由此導致營銷內容存在各種潛在的內容風險。例如,AIGC 技術創作的營銷文案含有「最好」、「第一」、「世界級」、「全網首發」等「絕對化」的用語,生成的營銷圖片或影片中可能含有低俗低質的不良內容,它們一旦出現在廣告中,不僅會損害品牌形象,還會引起公眾的反感。
對此,火山引擎提供了一整套有針對性的內容風險檢測引擎,透過其多模態內容支援、多樣化的風險模型和實時風險評估功能,為企業打造了一個全面、高效的風險管理解決方案。
其中,針對營銷素材風險多樣性的問題,檢測引擎內建了上百個風險模型。例如,適用於營銷文案的廣告用語檢測模型,可以準確判斷文案中是否含有絕對化用語、虛假宣傳、以及誘導消費的違規內容;而適用於營銷影片的畫面質量和版權檢測模型,可以判斷影片中是否包含不良畫面和低質內容,以及是否存在侵權可能。
此外,為了有效轉化目標使用者,企業往往不惜投入重金開展各種營銷活動,如新人獎勵、任務獎勵等,以期提升使用者粘性。然而,這些充滿誘惑的獎勵機制,也可能成為黑產眼中的「肥肉」,他們利用漏洞作弊,將企業的營銷資金佔為己有。
例如,一家車企在開展線上營銷活動時,遇到虛假助力和虛假試駕這兩大棘手問題。接入火山引擎智慧風控產品後,短短兩個月,他們就有效識別出異常行為 108 萬次、異常賬戶超 3 萬個,異常裝置 2 萬餘臺,直接止損金額達 50 萬元,不僅有效降低了營銷費用的浪費,還極大提升了業務轉化率。
NVIDIA 企業級開發者社群高階經理何琨則介紹了一款超酷的工具 ——NeMo Guardrails,它就像是大語言模型的「保鏢」,避免它們胡言亂語。
據何琨介紹,NeMo Guardrails 是一個開源工具庫,透過新增可程式設計護欄來控制大型語言模型的輸出,防止敏感話題、不當言論和惡意攻擊。它包括話題限定、對話安全和攻擊防禦三大護欄,支援自定義對話邏輯,確保對話機器人的響應符合特定請求和預定義邏輯。
NeMo Guardrails 的工作流程包括接收使用者輸入、匹配生成護欄、執行對話邏輯流和生成機器人回答。它使用 Colang 語言定義對話邏輯,這是一種用於對話式 AI 建模的語言,具有高度可讀性和可擴充套件性。此外,NeMo Guardrails 可以與 LangChain 結合使用,支援多種大語言模型對話引擎,實現更安全的對話系統輸出。
第五期回顧觀看地址:https://vtizr.xetlk.com/s/7CjTy(或識別下方二維碼)。