今年 6 月,Stability AI 隆重發布了 Stable Diffusion 3 系列的首個開源版本 Stable Diffusion 3 Medium,雖然該版本在影像生成方面確實取得了一定的進步,但它在生成人像以及細節方面仍存在不足。
經過數月的精心打磨和最佳化,Stability AI 推出了全新的模型 Stable Diffusion 3.5 系列,該系列包含 3 個版本:Large (8B)、Large Turbo (8B) 和 Medium (2.6B)。其中,Stable Diffusion 3.5 Large 是該系列中最強大的模型,擁有 80 億引數,能夠生成高達 100 萬畫素解析度的影像,並且可以生成風格更為多樣化的影像。分析表明,Stable Diffusion 3.5 Large 的提示詞遵循能力 (Prompt Adherence) 處於市場領先地位,並且在生成影像質量方面 (Aesthetic Quality) 可與更大型號的模型相媲美。
不同模型的提示詞遵循能力與影像生成質量對比
HyperAI超神經教程版塊現已上線「Stable-Diffusion-3.5-Large 影像生成 Demo」,無需輸入任何命令,一鍵克隆即可快速體驗!
封面圖各元素均由 Stable Diffusion 3.5 Large 生成
教程地址:
https://go.hyper.ai/JiAMY
Demo 執行
- 登入 hyper.ai,在「教程」頁面,選擇「Stable-Diffusion-3.5-Large 影像生成 Demo」,點選「線上執行此教程」。
- 頁面跳轉後,點選右上角「克隆」,將該教程克隆至自己的容器中。
- 點選右下角「下一步:選擇算力」。
- 頁面跳轉後,選擇「NVIDIA RTX 4090」以及 「PyTorch」映象,點選「下一步:稽核」。新使用者使用下方邀請連結註冊,可獲得 4 小時 RTX 4090 + 5 小時 CPU 的免費時長!
HyperAI超神經專屬邀請連結(直接複製到瀏覽器開啟):
https://openbayes.com/console/signup?r=Ada0322_QZy7
- 確認無誤後,點選「繼續執行」,等待分配資源,首次克隆需等待 2 分鐘左右的時間。當狀態變為「執行中」後,點選「API 地址」邊上的跳轉箭頭,即可跳轉至 Demo 頁面。請注意,使用者需在實名認證後才能使用 API 地址訪問功能。
效果演示
- 開啟 Demo 介面後,輸入 Prompt 和 Negative Prompt 後,點選「Run」即可快速生成高質量影像。
- Prompt: A classic Halloween scene of a witch soaring through the night sky on her broomstick, silhouetted against a bright full moon. Style: Photorealistic, cinematic.
- Negative Prompt: disabled, unclear, ugly
- 嘗試一下不同的風格的 Prompt,可以看到它很好地識別並生成了具有相應風格特徵的影像。
- Prompt: An elven princess with flowing silver hair and iridescent wings, standing amidst an ancient forest, her eyes filled with wisdom and a deep connection to nature. Style: Fantasy, ethereal.
- Negative Prompt: disabled, unclear, ugly
我們建立了「Stable Diffusion 教程交流群」,歡迎小夥伴們入群探討各類技術問題、分享應用效果~
新增神經星星微信(微訊號:Hyperai01),備註「SD 教程交流群」,即可加入群聊。