Open main menu
IT人
這家世界模型公司釋出中國版Sora級影片生成大模型,走向世界模型打造新一代資料引擎
机器之心
發表於
2024-06-11
原文網址 :
https://www.jiqizhixin.com/articles/2024-06-11-16
世界模型
Sora
大模型
Sora 炸場之後,
影片生成
持續廣受關注,不斷掀起新的熱潮。
近日,在奇績創壇路演日上,世界模型公司「極佳科技」聯合
清華大學
自動化系正式釋出中國首個超長時長、高價效比、端側可用的 Sora 級
影片生成
大模型「視界一粟 YiSu」,引起社會各界廣泛的反響和關注。
01 模型原生 16 秒,超長時長,超大運動,超強表現力;
不止步於 DiT,自研的
影片生成
技術路線
「視界一粟 YiSu」擁有模型原生的 16 秒超長時長,並可生成至 1 分鐘以上;同時還擁有超大運動、超強表現力、懂物理世界等眾多優勢;更重要的是,YiSu 模型成本更低、速度更快、端側可用;希望透過 YiSu 模型強大的效能和極致的價效比,更快實現長
影片生成
的大規模產品應用。
技術路線方面,年初 Sora 的爆火,讓 DiT 受到了業內極大的關注,很多公司和專案也開始復現 DiT 路線。極佳科技和
清華大學
研究人員在
影片生成
技術路線上有著深入的積累和獨特的理解,在 autoregressive、Masked Token、DiT、UNet 等不同路線方面均擁有豐富的經驗。此前,團隊提出 WorldDreamer,是全球第一次以 Transformer 和 LLM(Masked Token 路線)為中心的
影片生成
工作。
「視界一粟 YiSu」基於團隊自研的
影片生成
大模型技術,並沒有止步於 DiT,而是融合 LLM 和擴散模型的自研架構,結合各種路線的優勢,在多模態融合、訓練效率、推理效率、模型效果等方面達到極致的最佳化,打造
影片生成
的最佳方案。
02
影片生成
只有做到模型原生 16 秒,做應用才有價值;
“影片 - Native” 的爆款應用更有可能走向超級應用
目前大部分的
影片生成
應用,都是基於 3-5 秒的
影片生成
模型,應用和體驗上限制比較明顯。極佳科技 CEO 黃冠認為,“只有
影片生成
做到模型原生 16 秒(以及更長),同時保持自然的運動和表現力,做應用才有價值。”
過去兩年我們看到了多個 “語言 - Native” 和 “影像 - Native” 的爆款應用,已經徹底改變人們的工作生活很多方面,下一個就輪到影片方向了。通用智慧時代的目前階段,領先的模型就是爆款的應用。基於「視界一粟 YiSu」的驚豔效果,極佳科技正在打造 “AI-Native” 和 “影片 - Native” 的爆款應用,希望給廣大使用者帶來 AI 時代不一樣的體驗和價值。
面向通用智慧時代,全球都在期待 “AI-Native” 的超級應用。
語言模型
展現了強大的對話、理解、總結、推理等文字方面的能力,展現了通用智慧的曙光;
影像生成
模型展現了強大的自然生成、娛樂和藝術能力。而在目前人們已經已經習慣影片內容的時代,文字和影像的內容似乎仍然對於廣大使用者的價值仍然比較有限。
影片生成
可能是打破這一局面的重要技術突破,“影片 - Native” 的爆款應用更有可能走向超級應用,擁有無限的想象空間。
極佳科技 CEO 黃冠認為:
“超級應用對於通用智慧時代至關重要。AI 1.0 時代,依靠的是場景驅動的資料閉環,打造資料飛輪,不斷最佳化模型和應用效果。進入通用智慧的 AI 2.0 時代,最重要的是基礎模型和超級應用兩條腿走路,打造智慧閉環,形成智慧飛輪。極佳科技希望透過基礎模型和超級應用形成的智慧閉環飛輪,加速走向通用智慧時代。”
03 從
影片生成
走向世界模型
打造通用智慧的新一代資料引擎
OpenAI 把 Sora 叫做世界模擬器,從
影片生成
走向世界模型,會成為通用智慧的新一代資料引擎,對於自動駕駛、通用機器人等物理世界的通用智慧擁有極其關鍵的作用。世界模型在資料生成、閉環模擬、端到端方案等方面都具有重要的價值。YiSu 也展示了基於
影片生成
的同款架構,用於自動駕駛和機器人場景世界模型的效果。
極佳科技在世界模型的技術和應用上都保持行業領先。2023 年 9 月,極佳科技推出了全球首個真實世界驅動的自動駕駛世界模型 DriveDreamer,早於 Wayve 的 GAIA-1;2024 年 4 月,極佳科技進一步更新了 DriveDreamer-2,效能保持業內領先;2024 年 5 月,極佳科技聯合國內外多家單位推出了全球首篇通用世界模型綜述,該綜述透過 260 餘篇文獻,對世界模型在
影片生成
、自動駕駛、智慧體、通用機器人等領域的研究和應用進行了詳盡的分析和討論;該綜述還審視了當前世界模型的挑戰和侷限性,並展望了它們未來的發展方向。
基於業內領先的世界模型技術,極佳科技拿到業內首個世界模型商業化定點和落地,簽約多家主機廠和大客戶,服務自動駕駛、機器人等具身智慧客戶幾十餘家。極佳科技希望透過世界模型,攜手行業一起,加速走向物理世界通用智慧。
04
人工智慧
的頂尖綜合團隊
加速走向通用智慧時代
最後,再看一下「視界一粟 YiSu」背後的團隊 —— 極佳科技,這是一個世界級的
人工智慧
綜合團隊。
CEO
黃冠
是
清華大學
自動化系博士,擁有超過十年、全球領先的 AI 技術經驗,擁有微軟、三星、
地平線
等知名公司演算法經歷,多次帶領百人演算法團隊,還擁有 AI、自動駕駛、大模型等方向的連續創業經驗;首席科學家
朱政
則是中科院自動化所博士,
清華大學
自動化系博士後,發表 AI 方向頂級論文超過 50 篇,引用超過 1 萬次;產品負責人
孫韶言
是中科大博士,曾擔任
阿里雲
總監,
地平線
產品線總經理;演算法負責人
陳新澤
是中科院碩士,多次獲得 AI 比賽世界冠軍,擁有豐富的演算法研發、應用和 infra 經驗;工程負責人
毛繼明
是百度贏徹 T10 級別架構師,曾擔任 Apollo 模擬和工程負責人,擁有超過 16 年的資料、工程和分散式架構經驗。
團隊擁有超過十年的
人工智慧
技術研發經驗,在
人工智慧
方向擁有世界級的研發能力,發表 AI 頂級論文 200 餘篇,在過去十年的
人工智慧
技術浪潮中取得了全球領先的成績,曾獲得目標跟蹤全球最權威賽事 VOT 世界冠軍、
人臉識別
全球最權威賽事 NIST-FRVT 世界冠軍、影像
物體識別
全球最權威賽事 COCO 世界冠軍、自動駕駛全球最權威評測 nuScenes 世界冠軍,釋出 SiamRPN、WebFace260M、BEVDet、DriveDreamer 等視覺和 AI 方向知名或開創性技術成果。
團隊同時還擁有深入的大規模產業落地經驗,曾參與中國第一款嵌入式
人工智慧
晶片研發和應用,負責中國規模最大的智慧城市系統研發和應用,負責中國規模最大的資料閉環平臺研發和應用,負責 Apollo 模擬平臺研發和應用。
通用智慧時代,領先的技術能力和規模化的產業落地經驗,缺一不可,互為支撐。極佳科技核心團隊基於研究、工程、產品、商業以及創業等方面的頂尖綜合積累,打造基礎模型和商業應用的智慧閉環飛輪。
極佳科技成立於 2023 年,目前已經獲得多家一線財務投資機構、產業投資機構的投資,同時獲得了行業客戶的廣泛認可。年初 Sora 的爆火,以及「視界一粟 YiSu」的推出,正式標誌著
影片生成
和世界模型方向正在進入快速爆發的 Scaling Law 時代,未來極佳科技希望透過更多的技術和產品創新,為使用者和客戶提供更多的價值,加速走向通用智慧時代!
相關文章
文生影片Sora模型釋出,是否引爆AI晶片熱潮
2024-02-29
Sora
模型
AI晶片
火山引擎釋出大模型訓練影片預處理方案,已應用於豆包影片生成模型
2024-10-15
大模型
Sora之後,蘋果釋出影片生成大模型STIV,87億引數一統T2V、TI2V任務
2024-12-12
Sora
蘋果
大模型
開源!上海AI Lab影片生成大模型書生·築夢 2.0來了
2024-09-23
AI
大模型
CityDreamer4D: 下一個世界模型,何必是影片生成模型?
2025-01-28
世界模型
大資料專家級技能模型與學習指南
2022-07-31
大資料
模型
火山引擎釋出豆包大模型文旅解決方案
2024-08-15
大模型
一個支援Sora模型文字生成影片的Web客戶端
2024-02-26
Sora
模型
Web
客戶端
mplus資料分析:增長模型潛增長模型與增長混合模型再解釋
2022-03-09
模型
國產影片大模型奮起直追 Pika、阿里同日釋出“對口型”利器
2024-03-04
大模型
阿里
企業大模型落地關鍵是什麼?這家領先的大模型技術和應用公司給出答案
2024-12-16
大模型
近期大模型AIGC概要:Adobe釋出AI編輯影片等
2024-04-17
大模型
AI
GC
搞懂:MVVM模型以及VUE中的資料繫結資料劫持釋出訂閱模式
2020-05-20
MVVM
模型
Vue
模式
大模型Grok-1.5釋出
2024-03-30
大模型
開源社群引數量最大的文生影片模型來了,騰訊版Sora免費使用
2024-12-03
模型
Sora
Python資料模型
2019-02-16
Python
模型
Cassandra 資料模型
2018-08-26
模型
Hadoop資料模型
2020-09-24
Hadoop
模型
Sora是世界模擬器嗎?全球首篇綜述全面解析通用世界模型
2024-05-13
Sora
世界模型
【推理引擎】ONNX 模型解析
2022-03-27
模型
中國大模型大全
2024-11-29
大模型
資料分析八大模型:同期群模型
2022-02-21
大模型
OpenAI Sora真的有自己的物理模型嗎?
2024-02-18
OpenAI
Sora
模型
資料倉儲 - 星座模型、星型模型和雪花模型的介紹
2023-02-27
模型
技能大模式Skill Model重磅釋出 浪潮"源"大模型加速AI生產力升級
2022-07-01
模式
大模型
AI
Google釋出pQRNN新NLP模型:基於投影的高效模型架構
2020-09-22
Go
RNN
模型
架構
螞蟻集團WAIC釋出大模型密算平臺,助力大模型破解資料供給挑戰
2024-07-05
AI
大模型
景聯文科技榮登《2023資料標註公司排行》和IDC中國AI大模型生態圖譜
2023-03-01
AI
大模型
36個頂級資料分析方法與模型!
2023-11-15
模型
年末驚喜!ByteDance Research影片理解大模型「眼鏡猴」正式釋出
2025-01-25
大模型
如何打造一個大模型生成的資料目錄?
2023-11-24
大模型
ElevenLabs用AI為Sora文生影片模型配音 ,景聯文科技提供高質量真人音訊資料集
2024-03-06
AI
Sora
模型
音訊
Apache SeaTunnel 2.3.7釋出:全新支援大型語言模型資料轉換
2024-09-02
Apache
模型
大模型走向物理世界,TeleAI 釋出大模型驅動的具身智慧綜述,覆蓋300篇文獻
2024-09-04
大模型
AI
登上生圖排行榜第一的red_panda,是家創業公司,不是國產模型
2024-10-31
創業
模型
Mysql資料庫-資料模型
2024-05-26
MySql
資料庫
模型
食堂中的生產-消費模型
2018-07-22
模型
Facebook開源模型可解釋庫Captum,這次改模型有依據了
2019-10-15
模型
APT