9月23日,美圖公司宣佈美圖奇想大模型(MiracleVision)影片生成能力完成全面升級,在實現生成能力、生成效率以及模型效能的三重進階基礎上,結合美圖在計算機視覺領域的多項自研技術優勢,影片生成時長與畫質、流暢性、真實性及可信度等方面提升顯著。
目前,美圖奇想大模型(MiracleVision)的單次文生影片時長、單次圖生影片時長均達5秒,已支援1分鐘、幀率24FPS、解析度1080P的超長影片生成,可以任意影片尺寸輸出。
基於美圖公司在影像領域的長期深厚積累,全新升級的美圖奇想大模型(MiracleVision)結合對特徵的大範圍提取,實現了在藝術風格、細膩畫風、細節把控之間的高度平衡,並針對人像、動漫、國潮、商業設計等領域進行最佳化,具備強大的風格泛化力與兼具藝術審美的視覺表現力。此外,在複雜3D時空精準重構基礎上,影片生成能夠重現真實物理規律,支援大幅度流暢運動。
美圖奇想大模型(MiracleVision)於2023年6月上線,2024年1月透過國家備案,2024年6月迭代至V5版本並升級為Diffusion與Transformer模型結合的全新技術路線,採用DiT影片生成架構。
在新的技術路線下,相較業界先頭兵,美圖奇想大模型(MiracleVision)選擇優先攻克更具挑戰性的問題。此次升級,美圖奇想大模型(MiracleVision)在技術層面上解決了主體一致性、運動連貫性、物理邏輯合理性等影片生成能力落地的核心問題。
目前,美圖奇想大模型(MiracleVision)全新影片生成能力已應用於美圖旗下部分產品,憑藉高度可複用的模組化能力,升級優勢將逐步覆蓋美圖秀秀、美顏相機、Wink、開拍、美圖設計室、WHEE、MOKI等產品,進一步深化美圖在影片工具賽道的應用深度與廣度。
作為美圖AI產品生態的基石,美圖奇想大模型(MiracleVision)堅持以使用者需求場景驅動技術研發模式,追求使用者體驗和技術進步的平衡。本次升級完成後,美圖奇想大模型的架構進一步完善,從AI影像、AI影片、AI設計三個維度,全方位支援美圖AI產品生態的豐富與進步,切實提升使用者的體驗與效率,深化美圖公司在電商、廣告、遊戲、動漫、影視領域的應用實踐。