AI好好用報導
終於識得Sora真面目。
10 日凌晨,OpenAI 直接開放了 Sora 的新版本 ——Sora Turbo,ChatGPT Plus 和 Pro 使用者可以直接上手體驗。
連結直達:https://sora.com/
相較於今年 2 月 16 日釋出的 Sora 預覽版,這個新版本速度更快,功能也更全,一口氣上線了 Remix、Re-cut、混合、故事板剪輯、風格預設等多項功能。
(檢視詳情,請移步:剛剛,OpenAI Sora 正式炸裂登場,網頁擠爆了!)
Sora 吊了太長時間的胃口,此次一經上線,網站直接被擠崩。
不過,還是有不少博主在社交平臺上放出了一手體驗。
知名科技博主 @MKBHD從上週就用上了 Sora 最新版。在嘗試了各種風格和角色、向它丟擲了幾十個提示詞後,最終得出了以下結論:
搞抽象,或者生成藝術風格鏡頭,那水平絕對一流,但一遇到寫實風格,別的大模型有的毛病,Sora 照樣有。
-1-
生成效果很逼真,但文字仍會亂碼
Prompt :CBS style of video of news coverage of a recent fog event. 提示詞:CBS 對近期大霧事件的新聞報導影片。
眾所周知,AI 經常會把文書處理成一些奇怪的「鬼畫符」,Sora 生成的這段影片也不例外,其中包含了很多混亂的文字。
不過,Sora在生成影片時能夠模擬一些影片編輯技巧,如插入不同鏡頭、製作捲軸效果,以及模擬新聞風格的影片拍攝,生成的新聞主播看起來也很真實。
-2-
難以理解和模擬現實世界中的物理規律
Sora 並未對影片中的物體產生「理解」,模型仍然容易出現「幻覺」,主要表現為不合邏輯的運動,以及缺乏物理恆常性。
比如,生成的影片中物體會相互穿透,或者無故消失和重現等。
Prompt :A black tech reviewer talking about a smartphone, while sitting at a desk in front of 2 displays. 提示詞:一位黑人技術評論員坐在辦公桌前,面對兩臺螢幕談論一款智慧手機。
在這段影片中,黑人小哥的表情、動作還挺逼真流暢,但是細究起來也有不少 bug。
比如,黑人小哥右手拿的手機總是憑空出現或消失,而且他的左手會在不經意間多根手指或少根手指。
同時,Sora 也並未嚴格遵循文字描述,黑人評論員不是面對兩臺螢幕,而是背對。螢幕中的圖片也都出現了手指畸變的情況。
Prompt :A high resolution drone shot of the Golden Gate Bridge on a clear morning with a the peak of the bridge poking through some thin clouds. 提示詞:在一個晴朗的早晨,無人機拍攝到的金門大橋的高畫質畫面,大橋的頂峰從薄薄的雲層中探出頭來。
影片中,跨海大橋上密密麻麻的小汽車在較大的運動幅度下,紛紛出現模糊、變形、憑空消失、無中生有等 AI 影片中常見的毛病。
Prompt:National Geographic style video of a person befriending a penguin. 提示詞:國家地理雜誌拍攝的與企鵝交朋友的影片。
Prompt:A side scrolling shot of a rhinoceros walking through a dry field of low grass plans. 提示詞:側滾動拍攝的犀牛在乾燥的低矮草地上行走的畫面。
Sora 生成的這隻犀牛的運動就更加驚悚了,要麼一躍而起,要麼在空中拐彎,總之,你永遠不知道它下一秒會落在哪裡。
-3-
圖生影片拉胯
在測試圖生影片時,該博主發現 Sora 有時根本不知道在特定圖片中,物體的方向或速度應該是怎樣的。
比如,他上傳一張自己騰空接飛盤的圖片,並輸入 Prompt:He catches the disc before landing.(他在落地前接住了飛盤。)
當人騰空幾乎與地面平行時,接下來就應該是在重力的作用下落地,但在 Sora 生成的影片中,男人好像擁有了某種超能力,硬生生往前飛出去好幾米。
再如這張和袋鼠的合照,Prompt:The kangaroo jumps over the man.(袋鼠從這個人身上跳過。)
最終生成的效果有種莫名的喜感:
-4-
媲美紀錄片的風景鏡頭
儘管 Sora 在模擬現實世界的物理運動存在一些侷限性,但在風景渲染方面表現出色。
它幾乎能夠生成任何無人機拍攝的標誌性景觀,或者創造出非常接近於紀錄片乃至低成本電影中使用的高質量鏡頭。
-5-
擅長動畫風格
相比於寫實風格,Sora等影片生成模型更擅長生成動畫。
一方面是因為動畫風格不需要嚴格遵守現實世界的物理規則,這減少了模型需要處理的複雜性。例如,在動畫中,物體可以無視重力飛行或者以不符合現實物理的方式變形。
另一方面,動畫通常具有風格化的特徵,如誇張的表情、色彩和形狀,這些特徵更容易被 AI 模型捕捉和模仿。
Prompt:Stop-motion claymation footage of Santa punching a snowman. 提示詞:聖誕老人打雪人的定格粘土動畫片段。
提示詞:claymation of a sentient ball of yarn cute character surfing. 提示詞:一個有感知能力的毛線球可愛角色的粘土動畫衝浪場景。
提示詞:They are singing and dancing in the moonlight. 提示詞:他們在月光下載歌載舞。
詳細測評影片連結:
https://www.youtube.com/watch?v=OY2x0TyKzIQ
文中影片連結:https://mp.weixin.qq.com/s/unHuNlw3kLkPp4ki1KZGgA
以後我們會帶來更多好玩的AI評測,也歡迎大家進群交流。