眼見未必為實,Sora“販賣”影視行業的焦慮
近日,好萊塢對AI文字生成影片模型Sora表現出極高的熱情,該模型具備令人驚歎的能力,僅需幾行簡短的文字,便可在短時間內創作出媲美電影預告片的生動影片。
起因是,美國開放人工智慧研究中心(OpenAI)公佈了其最新專案——AI文字生成影片模型Sora。(Sora是一個日語單詞,意為“天空”,創造者選擇這個名字,旨在激發人們對無限創造潛力的想象。)
泰勒·佩裡(Tyler Perry)原計劃在亞特蘭大斥資8億美元擴建工作室,但在目睹了Sora的強大能力之後,他暫時擱置了這一計劃。
身為一位具有遠見的企業家,佩裡敏銳地捕捉到Sora發展中所蘊含的無限機遇。但作為僱主、演員和電影製片人,他也想敲響警鐘:隨著技術的迅速進步,許多傳統工作崗位恐將面臨消失的風險。
Sora所生成的影片令人歎為觀止。畫面中,長毛猛獁象穿越層層疊疊的大雪,緩緩向你靠近;當鏡頭俯瞰建築物時,展現出白雪皚皚、人群熙攘的東京街頭景象。另一個場景則是一個絢爛多彩的珊瑚礁紙工藝品世界,五顏六色的魚兒和海洋生物在其中穿梭遊弋。
值得一提的是,這段令人印象深刻的20秒影片短片,其靈感來源於OpenAI精心編寫的特定提示。
人工智慧社群的電影製作人與開發人員認為,Sora是生成式AI領域的巨大飛躍和關鍵性進展,該工具讓很多曾經遙不可及的事情,如今都變成了現實。
“這比我想象的要提前了整整18個月。”Fable工作室的人工智慧製作人愛德華·薩奇(Edward Saatchi)坦言,“我被深深地震撼了。如今,人們對於生成式AI所創造出來的簡短片段或影像的狂熱和興奮正在逐漸‘消退’,相反,他們開始更加現實地思考,究竟何時才能在電影院裡欣賞到一部完全由AI製作的電影。”
Sora無疑是這場遊戲規則的改變者,引領著整個行業朝著全新的方向前進。“薩奇表示,“最新的30個片段還不錯,但並未達到那種精雕細琢的程度。”
儘管此前有傳聞稱OpenAI正在研發一款影片工具,但這次Sora的釋出依然出乎眾人意料,甚至連OpenAI內部其他團隊的成員都全然不知。
目前,Sora尚未對公眾全面開放,僅向紅隊成員(red teamers,指的是誤導資訊、仇恨內容和偏見內容等方面的專家)和部分創意人士(視覺藝術家、設計師、電影製作人)開放。這些受邀者致力於探索Sora可能存在的濫用風險,以確保其未來應用的合理性和安全性。
電影製作人保羅·特里羅(Paul Trillo)憑藉其廣受好評的人工智慧短片《謝謝你不回答》而出名,他同時為多家人工智慧公司提供工具開發方面的專業諮詢。
對於Sora所生成的影片質量和功能,他表示印象深刻。然而,在Sora成為一個開源應用程式,允許創作者完全定製和控制之前,特里羅對其能否顛覆整個行業持中立態度,他認為Sora可能只是一個“偉大科技公司的產品演示”。
特里羅強調,“從孤立的片段到製作一個以故事形式運作的工具,Sora還有漫長的路要走,以確保觀眾能夠完全沉浸在故事當中。對於那些初涉電影製作、渴望嘗試並驗證自己創意,但資源有限的人來說,Sora無疑提供了一個寶貴的平臺。然而,從專業的視角出發,我對它持保留態度,因為這涉及到對創作過程的控制,以及能否真正實現自己的意圖和願景。”
相較於Runway或Meta、谷歌等競爭對手的模型,Sora的表現在多個方面均有所超越。其高解析度的特性使得生成的影片在畫素美感上更勝一籌,尤其是在皮膚紋理、頭髮、倒影、水、樹葉等細節的處理上,Sora展現出了顯著的優勢。
此外,Sora還能夠製作長達60秒的影片,打破了以往3-8秒的限制,進一步拓寬了其應用場景和實用性。
薩奇指出,“這是迄今為止最大的奇蹟,預示著人工智慧電影將不再侷限於兩分鐘的短片,而是逐漸邁向電影或電視短片的領域。我們曾受限於使用3-8秒的鏡頭來敘述故事,如今,Sora的出現打破了這一侷限,為我們開啟了敘述更復雜故事的新篇章。”
Sora不僅具備出色的生成能力,更對世界上事物的運動規律有著深刻的理解。與其他生成式AI影片工具相比,Sora的獨特之處在於它能夠在提示中新增更為具體的導演動作或模擬攝像機運動的指令。
據薩奇所言,Sora的卓越之處體現在其鮮明的背景角色、逼真的動作以及主題間的互動與反應。OpenAI所釋出的影片中,海浪拍打懸崖的場景、小動物們嬉戲的畫面,以及行駛中火車車窗上的倒影,無不生動展示了Sora在這方面的強大實力。
特里羅還表示,他對Sora所展現的“時間一致性”感到震驚。傳統的AI影片工具往往難以準確理解鏡頭從起始到結束的全過程,它們只能依靠對單獨幀的推斷(或猜測)來模擬運動。這往往導致影片中出現小瑕疵,類似於“Gumby legs”的現象。在Sora生成的某個影片中,一個女人的腿在行走過程中發生了互換位置的情況,當涉及到跑步等動作時,其他模特的步態卻流暢自然。
《天橋》在呈現時間一致性方面更為出色,但特里羅認為這更像是一種“錯覺”。OpenAI將Sora描述為一個基於時空的“世界模型”,而非傳統的文字到影片生成器。特里羅認為,“如果想要生成的影片被認真對待,就必須具備這種連貫性和控制力,不能僅僅是基於猜測。Sora給人的感覺是,它有一條清晰明確的路徑,能夠準確捕捉並展現事物的運動和變化。”
另一個被特里羅稱為重大突破的是Sora將提示資訊分解成時間的能力。在這段影片中,一隻生物在森林中跳躍,隨後遇到了一朵蘑菇,蘑菇上有仙女在跳舞。Sora能夠理解複雜提示中的事件順序,並準確地呈現出多個事件應該發生的順序,這使其“更接近於成為一個可用的講故事工具”。
除了上述功能外,Sora還具備無縫影片迴圈和取樣靈活性等特性。其“無縫影片迴圈”功能源於其深入理解運動規律的能力,使得生成的影片能夠流暢迴圈,無明顯的斷點或跳躍。而“取樣靈活性”則為使用者提供了極大的便利,允許他們從不同的視角、幀或不同的長寬比來檢視同一提示,從而得到更為豐富和多樣化的視覺體驗。
此外,Sora還提供影片到影片的編輯功能,允許使用者輕鬆地將多個影片片段連線起來。OpenAI為此提供了一個生動的演示,一架無人機在羅馬鬥獸場上空翱翔,緊接著一隻蝴蝶輕盈地飄浮在絢麗的珊瑚礁之上。兩個截然不同的影片場景在Sora的編輯功能下被無縫融合,呈現出令人驚歎的視覺效果。
當多數人的目光聚焦於Sora影片中的主角時,特里羅卻被影片的背景所吸引。在人工智慧領域,一個常見的問題就是“遮擋”,即前景物體導致背景物體的改變或消失。
儘管OpenAI承認Sora在這一方面仍有待完善,但特里羅觀察到在Sora生成的影片中,一個人從牆前的文字旁走過,而文字卻始終保持清晰。這表明Sora不僅僅是一個基於擴散的模型,而是融合了更傳統的3D動畫環境和特效技術的混合體。
那麼,對於好萊塢而言,如今是否應該比幾周前更加擔憂被機器所取代?
特里羅說,“這種變革令人不安,但同時又很難不為之興奮。”
Sora目前仍存在明顯的短板。首要問題在於缺乏對話功能。薩奇指出,“人工智慧在模擬人類嘴部動作方面仍面臨巨大挑戰,實現這一點是它發展的關鍵所在。雖然Sora能夠創造出令人歎為觀止的60秒鏡頭,但是並不足以支撐起一部連貫的電影。”
特里羅進一步解釋道,“在部落格文章中,Sora的表現或許令人眼前一亮,但如果在同一地點為同一人物拍攝10張照片,我們便能看出它的實際表現如何。”
Sora看起來也有些過於完美,特里羅認為,“它可能缺乏其他人工智慧工具所擁有的不可預測性、幻覺或想象力。由於OpenAI非常擔憂該工具被濫用,因此設定了嚴格的引數來防止涉及性和暴力有關的應用程式。這使得電影製作人在嘗試向人工智慧解釋某些場景時感到失望,例如,他們曾試圖告訴人工智慧這是番茄醬而非血液,但結果並不盡如人意。
薩奇指出,“我們有了全新的《海斯電影製作守則》,雖然人工智慧可能製作出極具戲劇性的電影,但這對其發展來說並非好事。”
任何人工智慧工具的好壞都取決於它的介面設計。如果Sora的定製功能有限,或者操作不夠流暢,它就不會被電影製作者或家庭創作者採用。不過,特里羅說到,“這些都是暫時的障礙,未來Sora山寨版可能會得到廣泛應用。”
特里羅預測道:“或許兩年後,我們將看到一個開源的Sora模式,它擁有更多的控制能力,能為電影製作人提供所需的細節。”
即便好萊塢現在有意使用生成式AI,但是由AI創造的內容在版權方面仍面臨挑戰。Klaris Law律師事務所的執行合夥人愛德華·克拉里斯(Edward Klaris)律師指出,“電影公司必須謹慎行事,因為他們創作的任何內容都可能被視為機器創作,從而無法獲得版權保護。”
他表示,“事實上,在創作公共領域的作品,將生成式AI納入工作流程確實存在一定的風險。”
儘管電影行業尚未達到被顛覆的程度,但市場營銷領域已經開始感受到Sora帶來的影響。Sora的60秒短片便是一個絕佳的廣告示例。特里羅警告說,“電影行業應該對此保持警惕。”
隨著Shutterstock與OpenAI建立合作關係,Sora的大多數模型可能會基於OpenAI的素材庫進行訓練。特里羅設想,在不久的將來,Shutterstock可能會推出一項服務,允許使用者建立AI生成的影片,而非僅依賴現有的庫存素材。
特里羅堅信,“儘管Sora可能為行業吸引新人,但真正成功的藝術家仍是那些掌握傳統技能並懷揣獨特願景的人。我希望人們能夠獲得相同的報酬,而無需承受巨大的壓力。”
作為開發能夠自動生成《南方公園》劇集的人工智慧工具的研究團隊成員,薩奇認為,“我們正逐步邁向自動化製作人的世界,在沒有人類真實投入的情況下,AI生成的內容很難在電影和電視領域獲得關注。”
電影是一種協作媒體,而完全自動化的內容將失去協作的本質。
薩奇指出,“一年前,AI的支持者們聲稱一切都將發生改變,但到目前為止,並沒有發生太大的變化。每隔三年,矽谷都會告訴好萊塢,他們將徹底顛覆一切,但好萊塢總是能夠倖存並蓬勃發展。”
來自 “ https://www.indiewire.com/news/business/openai-sor ”,原文連結:https://blog.itpub.net/31545813/viewspace-3008902/,如需轉載,請註明出處,否則將追究法律責任。
相關文章
- 拒絕做焦慮販賣者的韭菜
- 焦慮
- OpenAI Sora對遊戲行業影響最大OpenAISora遊戲行業
- 滾動視差讓你不相信“眼見為實”
- 如何“販賣”你的故事?8個實用技巧
- 我是如何實現零焦慮的
- 眼見為實,看看MySQL中的隱藏列!MySql
- 而立之年的焦慮
- 加碼“狗臉識別”背後,曠視的AI商業化焦慮AI
- 傳統行業程式設計師的深度焦慮?——快來網際網路行業吧!行業程式設計師
- 程式設計師的焦慮程式設計師
- 我的焦慮源於哪裡?
- 石頭科技的增長焦慮
- 從.NET看微軟的焦慮微軟
- 北大研三,為何會這般焦慮?是讀博還是就業?就業
- 抑鬱、壓力和焦慮有多常見?(附原資料表)
- 企業數字化轉型:在焦慮中前行!
- 一個老程式猿的焦慮3
- 機器學習的數學焦慮機器學習
- 程式設計師,停止你的焦慮程式設計師
- 跨過焦慮的最終法則
- 蕉下收割“防曬焦慮”
- 遊戲人請不要焦慮遊戲
- 父母的焦慮,正製造印度教輔創業風口創業
- 全球八大科學家談計算機視覺的研發和應用:眼見為實計算機視覺
- 數業智慧心大陸 AI解答如何應對焦慮AI
- 遊戲直播下半場的焦慮症遊戲
- 一起教育的前進與焦慮
- 哎,該死的焦慮症又來了。
- 程式設計師為什麼焦慮於程式語言和框架?程式設計師框架
- 【眼見為實】自己動手實踐理解資料庫READ COMMITTED && MVCC資料庫MITMVC
- 影視行業復甦兩極分化行業
- 程式設計師如何克服焦慮?程式設計師
- [譯]新手開發如何克服焦慮?
- 程式設計師,你焦慮嗎?程式設計師
- “奶茅”伊利,困於中年焦慮
- 對虛假視訊的思考:當眼見也為虛,我們該怎麼辦?
- 計算機視覺逼近賽點,高估值AI公司的焦慮與未來計算機視覺AI