? 介面引數
- 在使用
Stable Diffusion
開源AI
繪畫之前,需要了解一下繪畫的介面和一些引數的意義 - 目前 AI 繪畫對中文提示詞的效果不好,儘量使用英文提示詞
- 最主要一些引數如下:
- Prompt: 正向提示詞,也就是
tag
,提示詞越多,AI
繪圖結果會更加精準 - Negative prompt: 反向提示詞,也就是反向
tag
- Width / Height:要生成的圖片尺寸。尺寸越大,越耗效能,耗時越久。
- CFG scale:
AI
對描述引數Prompt
的傾向程度。值越小生成的圖片越偏離你的描述,但越符合邏輯;值越大則生成的圖片越符合你的描述,但可能不符合邏輯。 - Sampling method: 取樣方法。有很多種,但只是取樣演算法上有差別,沒有好壞之分,選用適合的即可。
- Sampling steps: 取樣步長。太小的話取樣的隨機性會很高,太大的話取樣的效率會很低,拒絕機率高
- Seed: 隨機數種子。生成每張圖片時的隨機種子,這個種子是用來作為確定擴散初始狀態的基礎。不懂的話,用隨機的即可。
AI 繪畫
? 取樣器
- Euler a: 是個插畫,
tag
利用率僅次於DPM2
和DPM2 a
,環境光效菜,構圖有時奇葩 - Euler: 柔和,也適合插畫,環境細節與渲染好,背景模糊較深
- Heun: 單次出土平均質量比
Euler
和Euler a
高,但速度最慢,高step
表現好 - DDIM: 適合寬畫,速度偏低,高
step
表現較好,負面tag
不夠時發揮隨意,環境光線與水汽效果好,寫實不佳 - DPM2: 該取樣方式對
tag
的利用率最高,幾乎佔用80%
以上 - DPM2 a: 幾乎與
DPM2
相同,只是在人物的時候可能有特寫 - PLMS: 單次出圖質量僅次於
Heun
- LMS: 質感
OA
,飽和度與對比度偏低,更傾向於動畫風格 - LMS Karras: 會大改成最佳化的風格,寫實不佳
- DPM fast: 此為上界開發者所遺留的測試工具,不適合魔術師使用
取樣器列表
? 文生圖(txt2img)
- 文生圖(text2img): 根據提示詞
Prompt
的描述生成相應的圖片 - 選擇
繪畫模型(Stable Diffusion checkpoint)
►文生圖(txt2img)
►填寫正向提示詞(Prompt)
►填寫反向提示詞(Negative prompt)
►選擇取樣器(一般選擇DPM++ 2M Karras)
►設定取樣步驟(一般設定30)
►設定長寬(Width / Height,推薦 1024 * 1536)
►點選生成(Generate)
- 根據上面的步驟,即可透過文字生成圖片了,一般我們只要編寫
Prompt
即可,Negative prompt
一般都是固定的,限制一下水印,低質量以及其他可能出現的邏輯錯誤即可
文生圖
? 圖生圖(img2img)
- 圖生圖(img2img): 將一張圖片根據提示詞
Prompt
描述的特點生成另一張新的圖片 - 選擇
繪畫模型(Stable Diffusion checkpoint)
►圖生圖(img2img)
►填寫正向提示詞(Prompt)
►填寫反向提示詞(Negative prompt)
►選擇取樣器(一般選擇DPM++ 2M Karras)
►設定取樣步驟(一般設定30)
►設定長寬(Width / Height,推薦 1024 * 1536)
►點選生成(Generate)
- 將上傳一張圖片到圖生圖中,進行測試一下,這裡使用的是剛剛文生圖的照片,根據上面的步驟,點選生成,看看效果
- 可以看出:
AI
圖生圖,其實就是根據你上傳的圖片和你的Prompt
生成一張跟上傳差不多的照片
圖生圖
? 模型下載
- 模型網站推薦:https://civitai.com/
- 左上角的下拉框可以用來選擇模型,其中
v1-5-pruned-emaonly.safetensors
是預設模型 - 預設的模型畫出來的圖片比較醜,所以我們需要下載更好更適合的模型來繪畫
- 每個模型側重繪畫的風格不一樣,有些適合畫人,有些適合畫動漫,有些適合畫風景,根據自己的需求選擇適合自己的繪畫風格模型進行下載
- 下載好模型,將模型檔案放入到
models/Stable-diffusion
資料夾下,過載UI
,即可看到
模型下載