Sora上線即翻車?知名科技博主一手評測

AI好好用發表於2024-12-12

AI好好用報導

編輯:楊文
終於識得Sora真面目。
Sora 千呼萬喚始出來。

10 日凌晨,OpenAI 直接開放了 Sora 的新版本 ——Sora Turbo,ChatGPT Plus 和 Pro 使用者可以直接上手體驗。

連結直達:https://sora.com/

相較於今年 2 月 16 日釋出的 Sora 預覽版,這個新版本速度更快,功能也更全,一口氣上線了 Remix、Re-cut、混合、故事板剪輯、風格預設等多項功能。

(檢視詳情,請移步:剛剛,OpenAI Sora 正式炸裂登場,網頁擠爆了!

Sora 吊了太長時間的胃口,此次一經上線,網站直接被擠崩。

圖片

不過,還是有不少博主在社交平臺上放出了一手體驗。

Sora上線即翻車?知名科技博主一手評測

(Prompt:一隻獅子和一隻貓在田野裡玩耍)

Sora上線即翻車?知名科技博主一手評測


翻車來得猝不及防。

知名科技博主 @MKBHD從上週就用上了 Sora 最新版。在嘗試了各種風格和角色、向它丟擲了幾十個提示詞後,最終得出了以下結論:

搞抽象,或者生成藝術風格鏡頭,那水平絕對一流,但一遇到寫實風格,別的大模型有的毛病,Sora 照樣有。

-1-

生成效果很逼真,但文字仍會亂碼

Prompt :CBS style of video of news coverage of a recent fog event.

提示詞:CBS 對近期大霧事件的新聞報導影片。

Sora上線即翻車?知名科技博主一手評測

眾所周知,AI 經常會把文書處理成一些奇怪的「鬼畫符」,Sora 生成的這段影片也不例外,其中包含了很多混亂的文字。

不過,Sora在生成影片時能夠模擬一些影片編輯技巧,如插入不同鏡頭、製作捲軸效果,以及模擬新聞風格的影片拍攝,生成的新聞主播看起來也很真實。


-2-

難以理解和模擬現實世界中的物理規律

Sora 並未對影片中的物體產生「理解」,模型仍然容易出現「幻覺」,主要表現為不合邏輯的運動,以及缺乏物理恆常性。

比如,生成的影片中物體會相互穿透,或者無故消失和重現等。

Prompt :A black tech reviewer talking about a smartphone, while sitting at a desk in front of 2 displays.

提示詞:一位黑人技術評論員坐在辦公桌前,面對兩臺螢幕談論一款智慧手機。

圖片

在這段影片中,黑人小哥的表情、動作還挺逼真流暢,但是細究起來也有不少 bug。

比如,黑人小哥右手拿的手機總是憑空出現或消失,而且他的左手會在不經意間多根手指或少根手指。

同時,Sora 也並未嚴格遵循文字描述,黑人評論員不是面對兩臺螢幕,而是背對。螢幕中的圖片也都出現了手指畸變的情況。

Prompt :A high resolution drone shot of the Golden Gate Bridge on a clear morning with a the peak of the bridge poking through some thin clouds.

提示詞:在一個晴朗的早晨,無人機拍攝到的金門大橋的高畫質畫面,大橋的頂峰從薄薄的雲層中探出頭來。

圖片

影片中,跨海大橋上密密麻麻的小汽車在較大的運動幅度下,紛紛出現模糊、變形、憑空消失、無中生有等 AI 影片中常見的毛病。

Prompt:National Geographic style video of a person befriending a penguin.

提示詞:國家地理雜誌拍攝的與企鵝交朋友的影片。

圖片
在該影片中,男人不僅手裡憑空出現了一條小魚,而且他單膝跪下的動作變化也稍顯奇怪。
Prompt:A side scrolling shot of a rhinoceros walking through a dry field of low grass plans.

提示詞:側滾動拍攝的犀牛在乾燥的低矮草地上行走的畫面。

圖片

Sora 生成的這隻犀牛的運動就更加驚悚了,要麼一躍而起,要麼在空中拐彎,總之,你永遠不知道它下一秒會落在哪裡。


-3-

圖生影片拉胯

在測試圖生影片時,該博主發現 Sora 有時根本不知道在特定圖片中,物體的方向或速度應該是怎樣的。

比如,他上傳一張自己騰空接飛盤的圖片,並輸入 Prompt:He catches the disc before landing.(他在落地前接住了飛盤。)

圖片

當人騰空幾乎與地面平行時,接下來就應該是在重力的作用下落地,但在 Sora 生成的影片中,男人好像擁有了某種超能力,硬生生往前飛出去好幾米。

圖片

再如這張和袋鼠的合照,Prompt:The kangaroo jumps over the man.(袋鼠從這個人身上跳過。)

圖片

最終生成的效果有種莫名的喜感:

Sora上線即翻車?知名科技博主一手評測





-4-

媲美紀錄片的風景鏡頭

儘管 Sora 在模擬現實世界的物理運動存在一些侷限性,但在風景渲染方面表現出色。

它幾乎能夠生成任何無人機拍攝的標誌性景觀,或者創造出非常接近於紀錄片乃至低成本電影中使用的高質量鏡頭。

圖片


圖片


圖片


圖片


-5-

擅長動畫風格

相比於寫實風格,Sora等影片生成模型更擅長生成動畫。

一方面是因為動畫風格不需要嚴格遵守現實世界的物理規則,這減少了模型需要處理的複雜性。例如,在動畫中,物體可以無視重力飛行或者以不符合現實物理的方式變形。

另一方面,動畫通常具有風格化的特徵,如誇張的表情、色彩和形狀,這些特徵更容易被 AI 模型捕捉和模仿。

Prompt:Stop-motion claymation footage of Santa punching a snowman.

提示詞:聖誕老人打雪人的定格粘土動畫片段。
圖片
提示詞:claymation of a sentient ball of yarn cute character surfing.

提示詞:一個有感知能力的毛線球可愛角色的粘土動畫衝浪場景。

圖片

提示詞:They are singing and dancing in the moonlight.

提示詞:他們在月光下載歌載舞。

圖片

你有什麼看法?歡迎評論區聊聊~

詳細測評影片連結:

https://www.youtube.com/watch?v=OY2x0TyKzIQ

文中影片連結:https://mp.weixin.qq.com/s/unHuNlw3kLkPp4ki1KZGgA

以後我們會帶來更多好玩的AI評測,也歡迎大家進群交流。

圖片

相關文章