拿下近3億元融資後,愛詩上線新模型,AI影片生成速度殺入10秒大關

机器之心發表於2024-12-30

我們實測16個Prompt:生成速度比Sora還快,動漫效果行業SOTA。


前段時間,AI 毒液特效爆火,迅速攻佔抖音小紅書。

而想出這個「鬼點子」的正是愛詩科技。

他們把自家影片模型 PixVerse V3 和電影《毒液:最後一舞》進行聯動,搞出了這一熱門玩法。

圖片

此外,在 SuperCLUE 12 月文生影片測評結果中,PixVerse V3 綜合能力更是吊打 Sora。

圖片 圖片來源:https://mp.weixin.qq.com/s/yOkK5jG3D9d5xllqbUFDRA

短短一個月,火爆全球的 PixVerse 母公司又釋出了新一代影片模型 ——PixVerse V3.5。

該模型主打一個生成速度快、運動控制強,動漫和動畫效果還拿下行業第一。拿下近3億元融資後,愛詩上線新模型,AI影片生成速度殺入10秒大關先奉上幾個影片給大家摟一眼。 拿下近3億元融資後,愛詩上線新模型,AI影片生成速度殺入10秒大關

影片來自 X 博主 @aziz4ai:https://x.com/aziz4ai/status/1872614428598014298

還有網友稱這絕對是市場上最好的「圖片轉影片」模型。

圖片拿下近3億元融資後,愛詩上線新模型,AI影片生成速度殺入10秒大關

高畫質影片來自 X 博主 @vladimircherner:https://x.com/vladimircherner/status/1872978258444120224

自今年 1 月 PixVerse V1 版本上線以來,愛詩科技平均每 2-3 個月就有大的模型升級。

其中既有底層模型能力的提升,也有新功能的增加和使用者介面的最佳化。

接下來,我們就來個全方位測評,看看 PixVerse V3.5 究竟進化到何種程度了。

PixVerse 官網連結:https://app.pixverse.ai/

10 秒跑出一個影片

在這個使用者體驗至上的時代,AI 影片緩慢的生成速度無疑是讓使用者抓狂的「罪魁禍首」之一。

PixVerse V3.5 就在速度上卷出了新高度,據說是全球首個接近實時生成的高質量 AI 影片模型。

官方稱,使用 turbo 模式和解析度較小的圖片進行影片生成,等待時間不超過 10 秒,如果各方面條件給力,它能達到最快 5 秒的生成速度。

為了測評這一點,我們專門掐了下秒錶。

以外國老頭喝茶看電腦這張梗圖為例。我們選擇 turbo 模式並使用「聖誕戰袍」特效,PixVerse 僅需 7 秒左右的時間即可搞定。

圖片

頭髮花白、一本正經的老頭立馬換上清涼聖誕裝,秒變肌肉男。

圖片

AI 影片的生成速度是衡量效能的關鍵指標之一,因為它直接影響著使用者體驗和創作效率。

試想當你開啟 AI 影片生成應用,急需快速處理任務時,卻不得不面對漫長的排隊等待,以及像烏龜爬一樣的生成速度,這無疑會大大影響創作熱情。而 PixVerse V3.5 的出現,恰好解決了這兩大痛點。

此外,不同的應用場景對生成速度也有著不同要求。

在直播、遊戲等實時互動場景中,快速生成是必不可少的剛需;影視製作雖然對速度要求不那麼苛刻,但提升生成效率依然能顯著改善工作流程。

因此,PixVerse V3.5 此番提速,勢必會為內容創作開啟更多可能性。

運動控制強

一直以來,精確的運動控制都是 AI 影片的短板。

只要幅度變大,動作就會扭曲變形,即使是 Sora、Veo2 也免不了翻車。

圖片 Veo2 的生成效果

PixVerse V3.5 在運動控制方面下了大功夫,雖然遇到體操運動仍容易出 bug,但與上一代相比已經有了長足的進步。

比如我們讓它生成一段啦啦隊成員進行蹦床運動的影片。

女孩們跳躍的同時雙手開合,動作整齊劃一,沒有出現不自然的扭曲或變形。女孩飄揚的頭髮、蹦床的凹陷等細節 PixVerse V3.5 也處理得很逼真。

要知道,蹦床運動是一個技術、藝術和物理規律的綜合體。

它涉及重力、彈力等物理現象,還涉及多主體動作的協調性,這對於 AI 說來並非易事。拿下近3億元融資後,愛詩上線新模型,AI影片生成速度殺入10秒大關

Prompt:一群啦啦隊成員在蹦床上跳。

在下面這則小男孩奔跑的影片中,雖然生成的是慢鏡頭,但運動幅度大,小男孩也沒有出現左右腿不分、動作詭異的情況。

虛化的背景、蕩起的髮絲、泛起的塵土也都讓畫面更加真實。

圖片 Prompt:一個小男孩正在操場跑步。

我們使用它的圖生影片功能,試試經典的吃麵鏡頭。

上傳一張「皮衣刀客」黃仁勳的影像,輸入 Prompt:這名男子正拿著叉子吃義大利麵。

PixVerse V3.5 完美刻畫了從叉子夾面到入口、咀嚼、吞嚥的連貫動作,同時精準呈現了頸部的自然筋紋和皮衣在燈光下的細膩光澤變化。

圖片

畫質高畫質細膩

PixVerse V3.5 還是個細節控,很擅長處理光影、紋理以及人物的面部表情等。

同時,它支援多解析度,720P、1080P,甚至還可以升級為 4K 解析度。

比如一名時髦的女士走在繁華的大街上,畫面很有電影感。

女人微笑的表情、行走的動作以及衣服的褶皺都很自然逼真,就連背景中的行人也幾乎找不出什麼問題。拿下近3億元融資後,愛詩上線新模型,AI影片生成速度殺入10秒大關

Prompt:一名中年婦女行走在紐約的大街上。

PixVerse V3.5 不僅能完美還原真實場景,在非現實畫面的創作中也同樣表現驚豔。

西裝革履的金毛煞有介事地敲著打字機,那蔫頭耷腦的模樣,很有當代打工人的牛馬感。拿下近3億元融資後,愛詩上線新模型,AI影片生成速度殺入10秒大關

Prompt:一隻穿著西裝的狗,正在老式打字機上打字。

穿著廚師服裝的小狗手拿鏟子攤煎餅,虛化的廚房背景中擺著各式各樣的廚具、爐灶,細節滿分。拿下近3億元融資後,愛詩上線新模型,AI影片生成速度殺入10秒大關

Prompt:一隻穿著廚師服裝的狗在做煎餅。

不得不說,它生成的怪物史萊克簡直和動畫電影中一模一樣,毛衣的針織紋理也清晰可見。為了體現麥當勞這一場景,咖啡杯上特意印著大大的 Logo。拿下近3億元融資後,愛詩上線新模型,AI影片生成速度殺入10秒大關

Prompt:怪物史萊克在麥當勞喝咖啡。

我們再來看看它對於複雜提示詞的理解能力。

Prompt:low-angle tracking shot, 18mm lens. The car drifts, leaving trails of light and tire smoke, creating a visually striking and abstract composition. The camera tracks low, capturing the sleek, olive green muscle car as it approaches a corner. As the car executes a dramatic drift, the shot becomes more stylized. The spinning wheels and billowing tire smoke, illuminated by the surrounding city lights and lens flare, create streaks of light and color against the dark asphalt. The cityscape – yellow cabs, neon signs, and pedestrians – becomes a blurred, abstract backdrop. Volumetric lighting adds depth and atmosphere, transforming the scene into a visually striking composition of motion, light, and urban energy.

(低角度跟蹤拍攝,18 毫米鏡頭,汽車漂移,留下光線和輪胎煙霧的痕跡,創造出視覺衝擊力極強的抽象構圖,攝像機低角度追蹤拍攝,捕捉這輛橄欖綠色的時尚肌肉車駛近彎道的瞬間,隨著汽車急速漂移,鏡頭變得更加風格化,在周圍城市燈光和鏡頭光暈的照射下,旋轉的車輪和滾滾的輪胎煙霧在漆黑的瀝青路面上形成了光與色的交錯,城市景觀 —— 黃色計程車、霓虹燈和行人 —— 成為一個模糊的抽象背景。體積光增加了畫面的深度和氛圍,將這一場景轉化為一個由運動、光線和城市活力構成的視覺衝擊。)拿下近3億元融資後,愛詩上線新模型,AI影片生成速度殺入10秒大關

面對這一長串的文字描述,PixVerse V3.5 幾乎實現了每一個細節:低角度跟蹤鏡頭、輪胎煙霧,橄欖綠的車身、城市中閃爍的霓虹燈以及穿梭的黃色計程車…… 即便在高速運動場景中,畫面依然清晰穩定。

其電影級的鏡頭語言、光影效果和動態表現,不禁讓人想到《速度與激情》的經典畫面。

Prompt:A massive, terrifying monster appears among the skyscrapers in a dystopian city under a stormy night sky. The creature has glowing red eyes, sharp claws, and reptilian scales. Lightning flashes illuminate the dark cityscape, Helicopters circle in the background, while panicked citizens watch from the streets below. The atmosphere is tense, with a cinematic mix of chaos and awe .

(在狂風暴雨的夜空下,一個巨大、恐怖的怪物出現在一個烏托邦城市的摩天大樓之間。這隻怪物有一雙閃著紅光的眼睛、鋒利的爪子和爬行動物般的鱗片。閃電照亮了黑暗的城市景觀,直升機在背景中盤旋,而驚慌失措的市民則在下面的街道上觀望。氣氛緊張,混亂與敬畏交織在一起。)拿下近3億元融資後,愛詩上線新模型,AI影片生成速度殺入10秒大關
PixVerse V3.5 生成的畫面極具張力,怪物可怕的形象讓恐怖氛圍拉滿,遠處的閃電劃破夜空照亮整個城市,形成強烈的光影對比。

動畫效果一流

PixVerse V3.5 不僅擅長寫實風格,在動畫創作上表現也很出色。

只需輸入提示詞,就能直出日漫、3D 動畫等多種風格,畫面精美,絲毫不輸專業的動畫製作軟體。換句話說,其動畫效果已躋身行業頂尖水平。

Prompt:A cinematic shot, old Hollywood era musical. A group of tap dancing hamsters dance across a busy Christmas high street. light mist, light snow falling, 3D Animation.

(電影鏡頭,老好萊塢時代的音樂劇,一群倉鼠在繁忙的聖誕大街上跳著踢踏舞,輕微的薄霧,輕微的雪花飄落,3D 動畫。)

圖片

生成的畫面中,大街上張燈結綵,各種聖誕元素拉滿。擬人化的小倉鼠有節奏地跳著舞。

即使在多主體的情況下,PixVerse V3.5 仍能保持動作協調一致,畫面沒有出現虛化閃幀變形等問題。

Prompt: A meeting of a lion, a bear and a giraffe, all of them wearing suits,Disney style(穿著西裝的獅子、熊和長頸鹿開會,迪士尼風格。)

圖片

PixVerse V3.5 巧妙地抓住了迪士尼動畫的特點,角色表情豐富且誇張,毛髮、服裝以及環境的光影效果,都力求逼真和生動,配色也很舒服。

更有意思的是,角色邊指手畫腳邊侃侃而談的場景可太像打工人開會了。

我們再來試試圖生影片的風格化。

上傳一張美漫風格的圖片,輸入 Prompt: Two cars are engaged in a chase.

圖片

PixVerse V3.5 延續畫面風格特徵,讓靜態圖片瞬間動起來。兩輛汽車在街道上演追逐大戲,一路火花帶閃電,鏡頭也能隨著汽車而移動,變換不同的城市場景。

圖片

它還能生成黑白動漫風。這種風格強調線條和對比,PixVerse V3.5 使用粗獷的線條勾勒出人物和環境,並利用黑白對比增強視覺衝擊力。

天空飄落的雨絲、男人六親不認的步伐都讓畫面更加生動。

圖片 圖生影片。Prompt:The man walks to a car in a rainy night.

此外,它還能在畫面字型不出現亂碼的情況下,讓四個角色同時動起來,而且姿勢各異。

圖片 圖生影片。Prompt:Four assassins take up fighting stances.

進階玩法

除了模型升級外,PixVerse 還有更多進階玩法。

比如新增首尾幀功能。我們上傳兩張 AI 生成的寫實照片作為影片的首幀和尾幀,PixVerse 以此生成一段連貫的影片。

圖片

圖片

上效果:
圖片

它還趕在聖誕節前夕上線了一堆節日特效。

比如「聖誕禮物盲盒」特效,只需上傳一張圖片或影片,輸入「我想要……」的提示詞即可。

圖片

來看看效果:

圖片

以及「萬物皆可羊毛卷」特效,隨便上傳一張梗圖,就能秒變捲髮。

圖片

截至目前,它已經上線了 27 種特效,其中比較出圈的就有「成為肌肉猛男」、「愛的抱抱」、「掃射一切」等。

圖片

一番實測下來,我們可以清晰地看到 PixVerse V3.5 的進步。秒級生成速度為內容創作帶來前所未有的流暢體驗,精準的運動控制讓高難度動作不再「變形」,細膩的畫質表現更是將每一幀都打磨成了電影級畫面。

更令人驚喜的是,它在寫實與動畫兩個領域都展現出強大的駕馭能力,再配合豐富的特效玩法,極大地降低了影視創作門檻。

大家也快去體驗一波吧。

相關文章