剛剛！Stable Diffusion 3.5最強模型全家桶來了，三個型號

机器之心發表於2024-10-22

原文網址 : https://www.jiqizhixin.com/articles/2024-10-22-11

就在剛剛，Stability AI釋出了自家最強的模型Stable Diffusion 3.5，而且是一個全家桶，包含三個版本。

連結：https://huggingface.co/stabilityai

Stable Diffusion 3.5 可以滿足科研人員、業務愛好者、初創公司和企業的多樣化需求，其中包括：

Stable Diffusion 3.5 Large：該基礎模型擁有 80 億引數，效能優於競品模型並且響應迅速，是 Stable Diffusion 系列中最強大的模型。該模型非常適合 1 百萬畫素解析度的專業用例。

Stable Diffusion 3.5 Large Turbo：該模型是 Stable Diffusion 3.5 Large 的蒸餾版本，只需四步即可生成高質量影像，速度遠快於Stable Diffusion 3.5 Large。

Stable Diffusion 3.5 Medium：該模型擁有 25億引數，採用改進的MMDiT-X架構和訓練方法，可在消費級硬體上「開箱即用」，在質量和定製易用性之間實現了平衡。該模型能夠生成解析度在0.25到2百萬畫素之間的影像。

可以看到，以上模型均有較大幅度的升級。Stability AI 表示，在今年 6 月釋出Stable Diffusion 3 Medium後發現模型沒有滿足社群的期望。因此在聽到反饋意見後沒有采取快速修復措施，而是「花時間進一步開發了一個新版本，以推進改造視覺媒體的使命。」

模型開發技巧

在開發模型時，Stability AI優先考慮可定製性，以提供靈活的構建基礎。為了實現這一點，他們將Query-Key Normalization整合到transformer塊中，穩定了模型訓練過程並簡化了進一步的微調和開發。

為了支援下游靈活性，Stability AI還必須做出一些權衡。使用不同種子的同一提示可能會產生很大的輸出差異，這是有意為之，因為它有助於在基礎模型中保留更廣泛的知識庫和多樣化的風格。不過，缺乏特異性的提示可能會導致輸出不確定性增加，並且美學水平可能會有所不同。

尤其是針對Medium版本，Stability AI 對架構和訓練協議進行了一些調整，以提高質量、連貫性和多解析度生成能力。

模型的優勢

據介紹，Stable Diffusion 3.5各版本模型在以下多個方面表現出色：

可定製性：輕鬆微調模型以滿足特定創作需求，或根據定製的工作流程構建應用程式。

高效效能：經過最佳化，均可在標準消費級硬體上執行，尤其是 Stable Diffusion 3.5 Medium 和 Stable Diffusion 3.5 Large Turbo 型號。

多樣化輸出：無需大量提示，即可建立代表全世界的影像，而不僅僅是一種膚色和特徵的人。

風格多樣：能夠生成各種風格和美感的圖片，如 3D、攝影、繪畫、線條藝術以及幾乎任何可以想象到的視覺風格。

可見，在這一代的模型中，Stability AI已經提前考慮好了手機等裝置的執行。

此外，Stability AI表示，Stable Diffusion 3.5 Large在prompt adherence方面處於領先地位，並且在影像質量方面可與更大的型號相媲美。

Stable Diffusion 3.5 Large Turbo在同類模型中，推理速度最快，同時在影像質量和及時性方面保持了高度競爭力，即使與類似尺寸的非蒸餾模型相比也是如此。

Stable Diffusion 3.5 Medium 的表現優於其他中型型號，在prompt adherence和影像質量之間實現了平衡，使其成為高效、高質量效能的首選。

有人第一時間對比了Stable Diffusion 3.5 Large與FLUX 1.1 pro的生圖效果。

圖源：https://x.com/markopolojarvi/status/1848733375634272448

除了Hugging Face上託管的模型以外，還有更多訪問新模型的方式：

Stability AI API：https://platform.stability.ai/docs/api-reference#tag/Generate/paths/~1v2beta~1stable-image~1generate~1sd3/post
Replicate：https://replicate.com/stability-ai/stable-diffusion-3.5-large
ComfyUI：https://blog.comfy.org/sd3-5-comfyui/
以及DeepInfra

此外，在新版本模型中，Stability AI 從開發的早期階段就引入了安全、負責任的 AI 實踐。

最後，Stability AI 表示，Stable Diffusion 3.5 Medium 將在 10 月 29 日公開發布。不久之後，ControlNets 也將推出，為各種專業用例提供高階控制功能。

參考內容：
https://stability.ai/news/introducing-stable-diffusion-3-5
https://x.com/StabilityAI/status/1848729212250951911

歡迎 Stable Diffusion 3.5 Large 加入 🧨 Diffusers
2024-11-07
今年全球收入第一的SLG剛剛拿到版號了
2020-06-16
剛剛，李克強總理宣佈了人工智慧重大訊息
2018-03-05
人工智慧
VS Code剛剛增強Java開發功能 - foojay
2021-05-20
Java
剛剛，ChatGPT開始有了執行力！
2025-01-15
ChatGPT
剛剛，渤海大學給我們發來了一封感謝信
2021-07-22
剛剛，Python 3.10 正式釋出了！我發現了一個可怕的功能...
2021-10-11
Python
11個國家同時斷網，這個鍋運維來背剛剛好？
2018-12-18
運維
剛剛，OpenAI震撼釋出o1大模型！強化學習突破LLM推理極限
2024-09-13
OpenAI大模型強化學習
Stable Diffusion 生成個性圖片指南
2024-06-23
原來Stable Diffusion是這樣工作的
2024-06-06
史上最強通用NLP模型GPT-2：OpenAI剛又釋出7.74億引數版本
2019-08-22
模型GPTOpenAI
剛剛，我們感受了一波最「像人」的國產AI，模型還是開源的
2024-10-25
AI模型
剛剛，Llama 3.2 來了！支援影像推理，還有可在手機上執行的版本
2024-09-26
谷歌剛剛釋出讓照片動起來的VLOGGER
2024-04-02
谷歌
6144塊TPU，5400億引數，會改bug、解讀笑話，谷歌剛剛用Pathways訓練了一個大模型
2022-04-06
谷歌大模型
Stable Diffusion中的embedding
2024-04-25
Outpainting with Stable Diffusion on an infinite canvas
2024-08-08
AICanvas
stable diffusion 入門教程
2024-07-30
發完最後一篇論文，Stable Diffusion核心團隊全要離職了
2024-03-22
剛剛，給學妹普及了登入的兩大絕學
2020-09-28
Julia 1.7 剛剛釋出
2021-12-01
SwnoRabbit全家桶
2020-09-02
vue全家桶
2021-09-09
Vue
谷歌剛釋出了一款時尚“垃圾桶”
2019-05-11
谷歌
剛剛，Meta開源「分割一切」2.0模型，影片也能分割了
2024-07-30
模型
stable diffusion學習筆記
2024-03-09
筆記
Windows 部署 Stable Diffusion web UI
2024-04-02
WindowsWebUI
你的專案剛剛啟動？是時候考慮Globalization了！
2018-10-23
【換模型更簡單】如何用 Serverless 一鍵部署 Stable Diffusion?
2023-05-18
模型Server
來一份Android動畫全家桶
2018-05-20
Android動畫
線上教程 | 重回霸主地位，Stable Diffusion 3.5 輕鬆生成多元化風格影像
2024-10-31
如何搭建一個REACT全家桶框架
2019-04-02
React框架
用react全家桶+antDesign寫了一個習慣管理專案
2018-06-12
React
“奶茶妹妹”徹底無語！剛剛，劉強東正式宣佈：養豬去了！
2018-12-02
Node.js: 一個剛剛夠用的 HTTPS 伺服器
2019-03-04
Node.jsHTTP伺服器
剛剛，阿里巴巴達摩院又拿了一個最高獎
2019-08-30
阿里
剛剛下載一個最新的包，安裝有問題
2019-05-11

剛剛！Stable Diffusion 3.5最強模型全家桶來了，三個型號

相關文章