RTX 4090可跑、完全開源,最快影片生成模型問世,實測一言難盡

机器之心發表於2024-11-24

開源 AI 影片社群又一個重量級選手下場。


這個週末,押注開源人工智慧影片的初創公司 Lightricks,有了重大動作。

該公司推出了最快的影片生成模型 LTX-Video,它是首個可以實時生成高質量影片的 DiT 影片生成模型
圖片
在一塊 Nvidia H100 上,LTX-Video 只需要 4 秒就能生成 5 秒時長的 24FPS 影片,解析度 768x512,可以說影片生成速度比影片觀看速度還要快。同時 LTX-Video 完全開源,包括程式碼庫和模型權重。
圖片
LTX-Video共同作者和負責人。

「有史以來最快的文生影片模型誕生了。」
圖片
首先來看幾個影片生成官方 Demo。RTX 4090可跑、完全開源,最快影片生成模型問世,實測一言難盡RTX 4090可跑、完全開源,最快影片生成模型問世,實測一言難盡RTX 4090可跑、完全開源,最快影片生成模型問世,實測一言難盡
目前,使用者可以在 GitHub Hugging Face 上體驗預覽版 LTX Video。完整版釋出之後將免費供個人和商業使用,並即將整合到 LTX Studio 中。
圖片
專案地址:https://github.com/Lightricks/LTX-Video

我們嘗試生成了兩個影片,比如「a dog chasing a boy who is skateboarding」。RTX 4090可跑、完全開源,最快影片生成模型問世,實測一言難盡
再比如「a girl with an umbrella standing on a bridge, and a handsome man walking towards her」。RTX 4090可跑、完全開源,最快影片生成模型問世,實測一言難盡
試用地址:https://huggingface.co/spaces/akhaliq/anychat

接著來了解一下 LTX-Video 的細節。

LTX Video 是一個文字到影片和影像到影片模型,能夠以驚人的速度和精度實時建立動態影片。該模型可以在 RTX 4090 等消費級 GPU 上本地執行,無需專用裝置即可以低成本地生成高質量影片。

另外,LTX Video 基於開發人員的反饋和真實世界用例構建,可以提供自然逼真的結果。該模型做了高階定製化設計,可以流暢地整合各種外部工具,從而輕鬆地增強工作流。

在生成過程中,LTX Video 最大程度減少了閃爍和偽影,建立出具有出色細節和清晰度的高保真影片。每一幀都在精心製作下呈現清晰銳利、栩栩如生,符合使用者的視覺效果。

最後,LTX Video 實現了無縫的跨幀一致性,從角色到環境,可以保持連貫的視覺效果,將每個細節整合在一起。

未來,LTX-Video 還會有技術報告放出。
圖片

相關文章