線上教程 | 重回霸主地位，Stable Diffusion 3.5 輕鬆生成多元化風格影像

今年 6 月，Stability AI 隆重發布了 Stable Diffusion 3 系列的首個開源版本 Stable Diffusion 3 Medium，雖然該版本在影像生成方面確實取得了一定的進步，但它在生成人像以及細節方面仍存在不足。

經過數月的精心打磨和最佳化，Stability AI 推出了全新的模型 Stable Diffusion 3.5 系列，該系列包含 3 個版本：Large (8B)、Large Turbo (8B) 和 Medium (2.6B)。其中，Stable Diffusion 3.5 Large 是該系列中最強大的模型，擁有 80 億引數，能夠生成高達 100 萬畫素解析度的影像，並且可以生成風格更為多樣化的影像。分析表明，Stable Diffusion 3.5 Large 的提示詞遵循能力 (Prompt Adherence) 處於市場領先地位，並且在生成影像質量方面 (Aesthetic Quality) 可與更大型號的模型相媲美。

在這裡插入圖片描述

不同模型的提示詞遵循能力與影像生成質量對比

HyperAI超神經教程版塊現已上線「Stable-Diffusion-3.5-Large 影像生成 Demo」，無需輸入任何命令，一鍵克隆即可快速體驗！

在這裡插入圖片描述

封面圖各元素均由 Stable Diffusion 3.5 Large 生成

教程地址：

https://go.hyper.ai/JiAMY

Demo 執行

登入 hyper.ai，在「教程」頁面，選擇「Stable-Diffusion-3.5-Large 影像生成 Demo」，點選「線上執行此教程」。

在這裡插入圖片描述

頁面跳轉後，點選右上角「克隆」，將該教程克隆至自己的容器中。

在這裡插入圖片描述

點選右下角「下一步：選擇算力」。

在這裡插入圖片描述

頁面跳轉後，選擇「NVIDIA RTX 4090」以及「PyTorch」映象，點選「下一步：稽核」。新使用者使用下方邀請連結註冊，可獲得 4 小時 RTX 4090 + 5 小時 CPU 的免費時長！

HyperAI超神經專屬邀請連結（直接複製到瀏覽器開啟）：

https://openbayes.com/console/signup?r=Ada0322_QZy7

在這裡插入圖片描述

確認無誤後，點選「繼續執行」，等待分配資源，首次克隆需等待 2 分鐘左右的時間。當狀態變為「執行中」後，點選「API 地址」邊上的跳轉箭頭，即可跳轉至 Demo 頁面。請注意，使用者需在實名認證後才能使用 API 地址訪問功能。

在這裡插入圖片描述

效果演示

開啟 Demo 介面後，輸入 Prompt 和 Negative Prompt 後，點選「Run」即可快速生成高質量影像。

在這裡插入圖片描述

Prompt: A classic Halloween scene of a witch soaring through the night sky on her broomstick, silhouetted against a bright full moon. Style: Photorealistic, cinematic.
Negative Prompt: disabled, unclear, ugly

嘗試一下不同的風格的 Prompt，可以看到它很好地識別並生成了具有相應風格特徵的影像。

在這裡插入圖片描述

Prompt: An elven princess with flowing silver hair and iridescent wings, standing amidst an ancient forest, her eyes filled with wisdom and a deep connection to nature. Style: Fantasy, ethereal.
Negative Prompt: disabled, unclear, ugly

我們建立了「Stable Diffusion 教程交流群」，歡迎小夥伴們入群探討各類技術問題、分享應用效果~

新增神經星星微信（微訊號：Hyperai01），備註「SD 教程交流群」，即可加入群聊。

線上教程 | 重回霸主地位，Stable Diffusion 3.5 輕鬆生成多元化風格影像

Demo 執行

效果演示

相關文章