這幾天,開啟社交媒體平臺,很多人正在熱烈討論一個叫做「AI 模特」的玩法。
點開幾個 Demo,確實驚豔。下方影片是一位海外網友自制的穿搭合輯,你能分得清這是 AI 還是真人嗎?
來源:https://x.com/mad_mask/status/1872522970050253178
一般來說,都是先有真人模特照片,用 AI 換裝也不新鮮。但這個平臺能一站式完成模特主體、換裝、展示影片的生成:
上述作品,都來自剛剛重磅更新的可靈 AI。
在 2024 年的尾聲,可靈 AI 給所有使用者送上了新年大禮包:全新的「可圖 1.5」和「可靈 1.6」,目前已全量上線。可圖 1.5 帶來了更豐富的場景層次、更自然的畫面細節和更真實人像生成。就說下方這兩張人像,你能確定哪個是實拍、哪個是可圖生成的嗎?答案揭曉:左圖為可圖大模型生成,右圖為真人實拍。AI 生成的水準,完全達到了以假亂真的程度。基於可圖大模型能力的更新,「AI 模特」功能也正式上線。Prompt:美麗的印度人,明亮面部,柔和光線,白色吊帶露出腰部,白色喇叭闊腿長褲,赤腳,,雙手自然深插褲袋,下巴微抬,目光平視鏡頭,表情冷靜自信,淺灰色背景,全身構圖,街拍風格讓這位 AI 模特換上指定款式的服裝,再使用一下可靈圖生影片功能,一條精美的服裝展示影片這不就有了嗎?看到這裡,感到震驚的不只是普通使用者,電商和廣告領域的從業者一定也陷入了沉思……是的,我們都知道 AI 會成為推進社會生產力的重要一環,只是沒想到這場變革來得這麼快,而且這麼徹底。如果你想上手嘗試,測評地址在這裡:https://klingai.kuaishou.com/從 2022 年的 Stable Diffusion 開始,過去兩年的文生圖領域是飛速發展的。不管是技術還是應用層面,都出現多次爆發式的增長。在這個過程中,眾多科技公司都推出了文生圖應用,並在「卷」的過程中將這一領域推向新的高度,包括 Midjourney、Stability AI,快手的「可圖」也是其中一支重要力量。當下的文生圖產品已經非常優秀,在很多生成任務的表現上近乎無可挑剔。剩下的難點主要集中於一些具體應用場景,比如對人像真實度、畫面細節豐富度等維度的把控。一方面,可圖 1.5 生成的畫面美感顯著提升,構圖與光影更加協調,人像美觀度大幅提升,呈現出更高階的美學效果。有網友嘗試用可圖 1.5 生成古風攝影,原圖直出就是驚豔的程度,人物一致性保持得也很好:作為尊貴的年卡黃金會員,機器之心也對可圖 1.5 模型進行了一場全面測評。我們發現,可圖 1.5 對亞洲人的人像生成更加擅長,相比之下,ChatGPT 給出的結果就不那麼如人意了。Prompt:高階時尚肖像,柔和魅力打光,亞洲女模特,飄逸黑色長髮搭配空氣劉海,身穿淺藍色襯衫式連衣裙,薰衣草花田背景,專業美妝攝影作為更適合中國使用者體質的文生圖應用,可圖 1.5 生成的人像髮絲根根分明,前額劉海的空氣感很強,五官和臉型也更符合我們對亞洲女孩的認知。將這張圖片一鍵輸入「圖生影片」,靜態人物鮮活了起來:Prompt:美女微微一笑,撥動了頭髮,動人心絃。另一方面,可圖 1.5 生成的畫面質量顯著提升。增強了畫面細節表現,色彩還原更加自然,層次感更加豐富。如下圖所示:Prompt:長髮女孩站在高處眺望城市全景,淺色上衣,遠處是山脈和城鎮以及中國傳統風格的建築群,屋頂整齊排列,延伸到遠方,背景是藍天白雲,雲朵層次分明,陽光明媚,兩側被青翠的山脈環繞,與城市形成鮮明對比,色調柔和,動畫風格,寧靜的氛圍。Prompt:生成一幅帶有 “merry christmas” 的電影海報,創意獨一無二的想像力,卡通風格,聖誕老人,禮物,大師作品,獲獎作品。可以看到,可圖 1.5 為海報設定了前景(聖誕老人)、中景(聖誕樹屋)、遠景(遠山和夜空)三個層次,由近處的暖色逐漸過渡到遠處的冷色,明暗對比強烈,製造出真實的深度感,並運用定向光源的元素為畫面增加了立體感。Prompt:土撥鼠擬人化,陽光透過廚房的窗戶,光線透過空氣中的麵粉產生丁達爾效應,耶穌光,一隻穿著藍色圍裙的土撥鼠媽媽在白色色調的廚房裡蒸饅頭,案板上放著已經整形好的饅頭,兩隻可愛的小土撥鼠在旁邊玩耍,身上沾滿了麵粉,精緻線條,溫暖的陽光,虛幻引擎渲染,8K 電影效果,真實的光影效果。一般來說,動物毛髮和麵粉狀態會是生成難點。在這幅畫中,土撥鼠的毛髮紋理非常逼真,具有明顯的柔軟感和立體感,且毛髮受光部位明亮,背光部分暗淡,細節清晰可見。案板上面團的質感細膩,表面略微反光,也體現出溼潤柔軟的特性。麵粉漂浮在空氣中的動態效果增加了畫面的活力,嚴格遵循了丁達爾效應的文字指令。土撥鼠的表情專注溫和,精準實現了擬人化特性的表達。據瞭解,基於可圖 1.5 模型的參考圖 / 墊圖功能正在快速趕來的路上,我們可以先期待一下。基於可圖大模型在人物生成方面的能力提升,一項極具應用潛力的新功能應運而生:AI 模特。我們都知道,在傳統的廣告片生產流程中,通常包含場景佈置、拍攝執行、後期調整等工作,演員、裝置、場地、道具、後期都需要一定的預算,且需要聘請專業團隊協作完成。現在,開啟可靈 AI 網站,任何使用者都可以透過文字描述,一鍵生成高質量的 AI 模特影像。並且,這種生成結果的視覺表現力完全是專業級的:精緻真實的五官細節、自然的姿態、清晰的服裝質感。當然,如果使用者生成素材的目的是用來展示商品,上圖的 AI 模特可以無縫銜接 AI 換裝功能,一鍵完成服裝更換和搭配展示。同時,基於可靈 1.6 的圖生影片能力,即可生成自然、真實的動態服裝展示影片,讓商品展示更具感染力與真實感。腦洞一下,以後的廣告片可能只需要拍攝商品圖,甚至不需要再聘請真人模特,也不需要搭建任何場景了。商業廣告場景之外,這種讓任意靜態圖動起來的一站式方案,還可以加速影視作品製作:目前在可靈 1.5 模型高品質模式中,還支援僅使用尾幀完成圖生影片,比如向前生成 5s/10s 的影片,非常適合生成商品展示、酷炫入場動效、遠景到近景等場景。Prompt:一幅影像從空白的白紙過渡到超流暢的無縫水墨筆觸,逐漸流暢,像宣紙上的水一樣融合在一起。筆觸柔和自然,影像有機地形成,每個元素都在連續、優雅的過渡中展現出來。AI 技術落地的應用場景往往是具體的,但產生的價值卻是非常宏偉的。對於普通人來說,技術能夠幫助他們跨越專業領域原本存在的一些門檻,以更低的成本和更高的效率接近目標。這讓我們想到一位業內人士關於《AGI 實現前夜》的思考:「我們目前的許多工作很快就會自動化,我們必須適應。如果你從一項特定的技能中獲得意義,這項技能可能在 5 年後就不再需要了。但如果你能從力所能及的幫助世界中獲得意義,那麼這種意義永遠不會消失。」在 2024 年的末尾回顧可靈 AI 這一年的發展歷程,一定會讓關注國產大模型的使用者們百感交集。作為國內頂尖的 AI 創意生產力平臺,自今年 6 月釋出以來,可靈 AI 至今已服務超過 600 萬使用者,生成 1.75 億張圖片和 6500 萬個影片。在文生圖上,不斷迭代「可圖」已成為行業內頂尖的模型之一。得益於在文字表徵方面的創新,以及影像資料對齊的大量工作,可圖可以畫出攝像級的畫面質感,經過強化學習的訓練,審美也和人類的普遍標準實現了對齊,並推出了「AI 試衣」、「AI 模特」等實用功能。在影片生成上,「可靈 AI」成為全球首個使用者可用的真實影像級影片生成大模型,繼 Sora 之後,宣告了全球影片生成領域的新一輪競爭開啟。不管是在畫質質量、動態質量、美學表現、運動合理性和語義理解層面的表現,還是「文生影片」、「圖生影片」、「影片續寫」、「運動筆刷」等功能的陸續釋出,都吸引了海內外使用者的持續關注。有人直呼:「Kling is killing!」這並非溢美之詞,今年來,海外社群的確在經歷一場中國 AI 飛速發展帶來的震撼。在即將到來的 2025 年,你對國產 AI 以及可靈 AI 有怎樣的期許呢?歡迎在評論區討論。