
論文標題:Seedream 2.0: A Native Chinese-English Bilingual Image Generation Foundation Model
論文地址:https://arxiv.org/pdf/2503.07703
技術展示頁:https://team.doubao.com/tech/seedream
構建綜合實力更強的模型





四維資料架構,實現質量與知識的動態平衡
優質資料層:精選高解析度、知識密度強的資料(如科學圖解、藝術創作),奠定質量基礎;
分佈維持層:採用雙層級降取樣策略,從資料來源維度對頭部平臺等比降維,從語義維度透過 10 萬級細粒度聚類維持多樣性;
知識注入層:構建 3 萬 + 名詞和 2000 + 動詞分類體系,結合百億級跨模態檢索,為資料注入文化特徵;
定向增強層:建立 “缺陷發現 - 資料補充 - 效果驗證” 閉環,最佳化動作序列、反現實生成等場景。

智慧標註引擎:三級認知進化
工程化重構:百億資料的流水線革命

原生雙語對齊方案,打破語言視覺次元壁
讓模型既看懂文字,又關注字型字形
三重升級 DiT 架構,讓影像生成縮放自如
多維度偏好資料體系,提升模型偏好上限
三個不同獎勵模型,給予專項提升
反覆學習,驅動模型進化