中文原生也是騰訊混元文生圖大模型的一大亮點。此前,像 Stable Diffusion 等主流開源模型核心資料集以英文為主,對中國的語言、美食、文化、習俗都理解不夠。 作為首箇中文原生的 DiT 模型,混元文生圖具備了中英文雙語理解及生成能力,在古詩詞、俚語、傳統建築、中華美食等中國元素的生成上表現出色。我們可以看以下一些生成示例。
騰訊混元文生圖還更擅長細粒度文字提示生成。
評測結果顯示,新一代騰訊混元文生圖大模型視覺生成整體效果,相比前代提升超過了 20%,不僅在語義理解、畫面質感與真實性方面全面提升,而且在多輪對話、多主體、中國元素、真實人像生成等場景下效果提升顯著。 這一次騰訊混元選擇全面開源文生圖模型騰訊混元文生圖能力,已經廣泛被用於素材創作、商品合成、遊戲出圖等多項業務及場景中。今年初,騰訊廣告基於騰訊混元大模型,釋出了一站式 AI 廣告創意平臺騰訊廣告妙思,可為廣告主提供文生圖、圖生圖、商品背景合成等多場景創意工具,有效提高了廣告生產及投放效率。 騰訊混元文生圖大模型的開源,填補了中文原生 DiT 文生圖架構的缺失,有助於更多的開發者和創作者參與進來,一起探索、共創基於 DiT 架構的視覺生成生態,更好地去驗證、挖掘這個技術架構的潛力。騰訊文生圖負責人蘆清林表示:「騰訊混元文生圖的研發思路就是實用,堅持從實踐中來,到實踐中去。此次把最新一代模型完整開源出來,是希望與行業共享騰訊在文生圖領域的實踐經驗和研究成果,豐富中文文生圖開源生態,共建下一代視覺生成開源生態,推動大模型行業加速發展。」基於騰訊開源的文生圖模型,開發者及企業無需從頭訓練,即可以直接用於推理,並可基於混元文生圖打造專屬的 AI 繪畫應用及服務,能夠節約大量人力及算力。透明公開的演算法,也讓模型的安全性和可靠性得到保障。此外,基於開放、前沿的混元文生圖基礎模型,也有利於在以 Stable Diffusion 等為主的英文開源社群之外,豐富以中文為主的文生圖開源生態,形成更多樣原生外掛,推動中文文生圖技術研發和應用。