影片生成要有自己的系統！尤洋團隊歷時半年開源VideoSys

机器之心發表於2024-08-26

原文網址 : https://www.jiqizhixin.com/articles/2024-08-26-3

影片時代需要自己的基礎設施。VideoSys 的目標是使影片生成對於每個人而言都簡便、迅速且成本低廉。

自今年起，OpenAI 的 Sora 和其他基於 DiT 的影片生成模型在 AI 領域掀起了又一波浪潮。但由於起步較晚，影片生成領域的很多基礎設施都還有待完善。

今年 2 月份，新加坡國立大學尤洋團隊開源的一個名為 OpenDiT 的專案為訓練和部署 DiT 模型開啟了新思路。這是一個易於使用、快速且記憶體高效的系統，專門用於提高 DiT 應用程式的訓練和推理效率，包括文字到影片生成和文字到影像生成。

專案上線後非常受歡迎，尤洋團隊也一直在繼續這方面的工作，包括增加對 Open-Sora 等模型的支援，開發 DSP、PAB 加速技術等。

最近，他們更是把這些進展都融合到了一起，開發出了一個名為 VideoSys 的影片生成系統。

團隊表示，與 LLM 不同，影片模型要處理長序列和複雜的執行流程。並且模型的每個元件都具有獨特的特徵，對記憶體和計算提出了不同的挑戰。

VideoSys 是一個簡單高效的影片生成系統，旨在讓影片生成對於每個人而言都簡便、迅速且成本低廉。

此外，它還是一個開源專案，為影片生成提供了一個使用者友好的高效能基礎設施。這個全面的工具包將支援從訓練、推理到服務和壓縮的整個 pipeline。它標誌著影片生成的新篇章。

從 OpenDiT 到 VideoSys，尤洋團隊的相關工作已經收穫了 1.4k 的 star 量。

專案連結：https://github.com/NUS-HPC-AI-Lab/VideoSys

VideoSys 的安裝、使用方法和相關技術如下。

安裝方法

安裝準備：

Python >= 3.10
PyTorch >= 1.13（建議使用 2.0 以上版本）
CUDA >= 11.6

強烈建議使用 Anaconda 建立一個新環境（Python>=3.10）來執行示例：

conda create -n videosys python=3.10 -y
conda activate videosys

安裝 VideoSys：

git clone https://github.com/NUS-HPC-AI-Lab/VideoSyscd VideoSys
pip install -e .

使用方法

VideoSys 透過各種加速技術支援許多擴散模型，使這些模型能夠執行得更快並消耗更少的記憶體。

你可以在下表中找到所有可用模型及其支援的加速技術。

加速技術

Pyramid Attention Broadcast (PAB)

PAB 是業內第一種可以實時輸出的、基於 DiT 的影片生成方法，無需任何訓練即可提供無損質量。透過減少冗餘注意力計算，PAB 實現了高達 21.6 FPS 的幀率和 10.6 倍的加速，同時不會犧牲包括 Open-Sora、Open-Sora-Plan 和 Latte 在內的基於 DiT 的影片生成模型的質量。值得注意的是，作為一種不需要訓練的方法，PAB 可以為任何未來基於 DiT 的影片生成模型提供加速，讓其具備實時生成的能力。詳情請參見機器之心報導：《史上首個實時 AI 影片生成技術：DiT 通用，速度提升 10.6 倍》

論文：https://arxiv.org/abs/2408.12588
部落格：https://arxiv.org/abs/2403.10266
文件：https://github.com/NUS-HPC-AI-Lab/VideoSys/blob/master/docs/pab.md

Dyanmic Sequence Parallelism（DSP）

DSP 是一種新穎、優雅、超高效的序列並行演算法，適用於 Open-Sora、Latte 等多維 transformer 架構。

與 sota 序列並行方法 DeepSpeed Ulysses 相比，它在 Open-Sora 中實現了 3 倍的訓練加速和 2 倍的推理加速。對於 10 秒（80 幀）的 512x512 影片，Open-Sora 的推理延遲如下：

論文：https://arxiv.org/abs/2403.10266
文件：https://github.com/NUS-HPC-AI-Lab/VideoSys/blob/master/docs/dsp.md

更多詳細資訊請參考該專案 Github 介面。

Laravel 團隊任務管理系統（已開源）
2019-06-03
Laravel
歷時2年，華人團隊力作，震撼開源生成式物理引擎Genesis，可模擬世界萬物
2024-12-19
歷時大半年，Github團隊成功減少30kb依賴體積
2021-05-18
Github
IT團隊適用的工時管理系統有哪些？
2022-12-05
尤拉的奇異之旅·共赴開源時代
2022-03-17
OKR系統改變您的團隊
2023-04-13
OKR
團隊效率-基建開源（持續更新）
2020-04-06
如何快速為團隊打造自己的元件庫（下）—— 基於 element-ui 為團隊打造自己的元件庫
2022-02-14
元件UI
不再開發統一的定製化作業系統 Meta解散XROS團隊
2022-02-28
作業系統ROS
8人小團隊單挑OpenAI，半年仿出GPT-4o，還開源了
2024-07-04
OpenAIGPT
個人/團隊/公司開源，Joyqi 談貢獻開源的「不同姿勢」
2022-12-15
【Java】基礎_14_開發團隊排程系統
2020-12-01
Java
中國需要自己的開源體系
2020-12-25
類似拼多多，多商戶拼團商城(開源),用thinkphp5開發的拼團開源系統
2019-05-11
PHP
袋鼠雲數棧技術團隊入選開源中國“2021年度優秀開源技術團隊”
2021-12-20
團隊演講影片及其ppt展示
2024-04-17
開源/免費的敏捷工具：Scrum團隊的增效秘訣
2023-10-15
敏捷Scrum
Laravel 團隊任務管理系統（持續開發、優化）
2019-05-16
Laravel優化
短影片軟體系統開發：選擇開源原始碼
2019-11-08
原始碼
vue init深度定製團隊自己的Vue template
2018-05-25
Vue
小米安全團隊開源Exchange_proxy專案
2019-03-15
部署MatterMost-開源團隊協作平臺
2024-08-06
企業銷售團隊使用CRM系統的作用
2023-03-24
Leaf：美團分散式ID生成服務開源
2019-03-08
分散式
.NET 開源實時監控系統 - WatchDog
2024-08-27
實驗八團隊作業5：團隊專案需求建模與系統設計
2021-06-07
實驗七團隊作業4：團隊專案需求建模與系統設計
2022-05-14
RTX3090可跑，360AI團隊開源最新影片模型FancyVideo，紅衣大叔都說好
2024-08-26
AI模型IDE
【開源】C#資訊抽取系統【招募C#隊友】
2018-07-10
C#
Chameleon跨端框架——一個理想主義團隊的開源作品
2019-05-06
Chameleon跨端框架
Chameleon跨端框架——壹個理想主義團隊的開源作品
2019-01-31
Chameleon跨端框架
解決歷理檢視自己的Windows系統是不是正版的
2024-06-01
Windows
小型團隊缺陷管理系統指南：如何選型
2024-07-26
Fedora 團隊宣佈 Fedora 36 系統釋出了
2022-08-05
架構團隊如何重構內部系統
2021-12-02
架構
CRM系統可以有效管理銷售團隊嗎？
2021-08-03
團隊作業3--需求改進&系統
2021-11-15
如何管理好團隊的工時表？
2023-05-17

影片生成要有自己的系統！尤洋團隊歷時半年開源VideoSys

相關文章