創繪簡介
1. 一鍵智慧AI推理提示詞,自動關聯上下文,畫面匹配度更高
2. 一鍵批次繪圖,同時支援本地和雲端模式(沒有顯示卡也能暢享繪圖)
3. 一鍵匯出剪映草稿,自動生成關鍵幀,快速圖文影片合成
4. 自帶全網熱門配音,30多種情感配音任君挑選
5. 基礎功能永久免費
6. 支援最新的webui forege版本,生圖速度快30%
7. 全網第一個支援消除音訊停頓的推文軟體,成片效果堪比專業的付費配音!免費音訊也支援消除停頓,不限時不限量。
創繪所需資源下載
01、創繪:https://pan.quark.cn/s/115a0747493c
02、sd-webui-aki:https://pan.quark.cn/s/f3169c0abcaf
03、剪映PC版:https://www.capcut.cn/
SD模型存放路徑
大模型:sd-webui-aki安裝目錄下\models\Stable-diffusion
lora模型:sd-webui-aki安裝目錄下\models\Lora
VAE模型:sd-webui-aki安裝目錄下\models\VAE
創繪配置
01、翻譯配置
騰訊翻譯用於推理提示詞
按照文件上的提示註冊一個騰訊翻譯的開發者賬號
註冊完成後將金鑰輸入到我們的軟體當中即可
02、剪映草稿設定
開啟剪映 -> 全域性設定 -> 草稿位置,然後點開 -> 複製地址 -> 開啟創繪 -> 基礎設定 -> 更改草稿位置,把剛才複製的地址貼上進去
03、SD模型配置
SD大模型:
模型存放路徑: sd-webui-aki\models\Stable-diffusion
模型網站推薦:���AI模型分享
模型推薦:majicMIX realistic 麥橘寫實 V7
https://civitai.com/models/43331/majicmix-realistic
迭代步數:推薦20~30
AI繪畫的原理用人話說就是,先隨機出一個噪聲圖片
然後一步步的調整圖片,向你的 提示詞 Prompt 靠攏
Sampling Steps就是告訴AI,這樣的步驟應該進行多少次。
步驟越多,每一步移動也就越小越精確。同時也成比例增加生成影像所需要的時間。
大部分取樣器超過50步後意義就不大了
提示詞權重:
影像與你的提示的匹配程度。
增加這個值將導致影像更接近你的提示,但過高會讓影像色彩過於飽和(你可以自己試試看)
太高後在一定程度上降低了影像質量。可以適當增加取樣步驟來抵消畫質的劣化。
一般在5~15之間為好,7,9,12是3個常見的設定值。
取樣方法:
推薦-DPM++2M Karras(參考對比:https://zhuanlan.zhihu.com/p/691261474)
使用哪種取樣器,人話就是讓AI用什麼演算法,這裡介紹幾個常用的
1. Euler a :富有創造力,不同步數可以生產出不同的圖片。 超過30~40步基本就沒什麼增益了。
2. Euler:最最常見基礎的演算法,最簡單的,也是最快的。
3. DDIM:收斂快,一般20步就差不多了。
4. LMS:Eular的延伸演算法,相對更穩定一點,30步就比較穩定了
5. PLMS:再改進一點LMS
6. DPM2:DDIM的一種改進版,它的速度大約是 DDIM 的兩倍
外觀VAE模型:
VAE一般用於美化圖片的色彩和細節微調,主要功能是濾鏡和微調;濾鏡就像是剪映、美圖秀秀、PS等軟體用到的濾鏡一樣,讓圖片的畫面看上整體色彩飽和清晰度更高;微調就是對出圖的部分細節進行細微調整。
常見檔案格式:尾綴ckpt、pt、safetensors(一般名字中會帶有vae的字樣)
常見檔案大小:100MB-800MB不等
模型存放路徑: sd-webui-aki\models\VAE
Loar模型
它是一個微調模型,主要是用於滿足對應特定的風格,或指定的人物特徵屬性進行定製。在資料相似度非常高的情形下,lora模型更加輕巧,訓練效率也更高,可以節省大量的訓練時間和訓練資源。
常見檔案格式: 尾綴safetensors、pt、ckpt
常見檔案大小:100MB-300MB不等
模型存放路徑1: sd-webui-aki\models\Lora
隨機種子:
AI繪畫的原理是,先隨機出一個噪聲圖片
因為計算機世界裡不存在真隨機
保持種子不變,同一模型和後端,保持所有引數一致的情況下,
相同的種子可以多次生成(幾乎)相同的影像。
如果你用某個種子在某tag下生成了很棒的圖,
保持種子數不變,而稍微改一點點tag,增減一點細節,一般得到的圖也會不錯。
• 不同型號的顯示卡即使引數與模型完全一致,也可能會生成完全不同的圖。
10XX和16XX系顯示卡基本每種型號都會是不同的結果,20XX系和30XX系基本都可以完美復現圖片。
• 這裡不是10XX系顯示卡不適合AI作畫的意思,只是你可能看網友的引數圖很棒,你想照搬一下結果卻大不一樣。
• 某些模型比如anything3.0因為模型過於混沌,影像復現效能一樣很差。
• 設定中有個選項引數叫ENSD( eta 噪聲種子增量)這個會改變種子,有些擴充套件也可以實現同seed下隨機微調種子,可能會造成無法復現其他人的圖。
放大演算法:
在高解析度下(1024X1024)會生成非常怪異的影像。而此外掛這使得AI先在較低的解析度下部分渲染你的圖片,再透過演算法提高圖片到高解析度,然後在高解析度下再新增細節。
放大演算法:如果不知道選什麼,一般無腦選“ ESRGAN_4x ”
重繪幅度:放大後修改細節的程度,從0到1,數值越大,AI創意就越多,也就越偏離原圖。
放大倍數(Upscale by) :在原有寬度和長度上放大幾倍,注意這個拉高需要更高的視訊記憶體的。
正面提示詞:
正向提示詞例子:
(masterpiece:1.4),best quality,highres,extremely detailed CG,perfect lighting,8k wallpaper,anime, comic,unreal engine,pretty,Animation style
反面提示詞:
一個通用的示例:
lowres,bad anatomy,bad hands,text,error,missing fingers, extra digit,fewer digits,cropped,worst quality, low quality,normal quality,jpeg artifacts,signature, watermark,username,blurry,missing arms,long neck, Humpbacked,missing limb,too many fingers, mutated,poorly drawn,out of frame,bad hands, unclear eyes,poorly drawn,cloned face,bad face
使用說明
01啟動SD
02打卡創繪,新建專案
03匯入指令碼,推理關鍵詞
04智慧繪圖-繪圖模式
初步生成圖片,覺得不好的分鏡可以單獨重繪
05智慧繪圖-放大模式
將生成的圖片放大成1080的
06合成草稿
注意事項:
01、漫畫推文的放大演算法推薦選擇R-ESRGAN 4x+ Anime6B
如果你開啟軟體發現自己沒有這個演算法可以選擇,請按照如下步驟操作:
將下載的演算法:4x-UltraSharp.pth
將演算法放置到到sd webui 下面的 models\ESRGAN目錄裡
02、SD進入擴充套件後如果發現載入不出來
試著把源改為
https://raw.githubusercontent.com/AUTOMATIC1111/stable-diffusion-webui-extensions/master/index.json
03、繪製出來的圖片風格不統一?
請在繪圖設定中,調整全域性正向詞,比如這裡設定為動漫風格
Animation style
04、匯入SRT後合成草稿配音不存在
匯出草稿提示音訊不存在,生成草稿失敗的解決方法【針對匯入SRT字幕和音訊】
重新建立一個專案,然後把音訊和srt拖動進去,然後開啟這個專案所在的那個資料夾,有一個audio,把這個資料夾替換到你已經配好了圖的那個專案相同名稱下,再點選合成就可以了,檔案路徑
05、幫助文件:
https://note.youdao.com/ynoteshare/index.html?id=ba9ead402507588e5b6307d8b5b7b3fd