為什麼擴散diffution模型如此強大? - Reddit
可以在這裡看到200行程式碼,但它背後的數學是如此簡單,這演算法智慧且簡單,但它的生成結果似乎比 GAN 更令人難以置信,而且它的速度很快,模型大小也不算大。
案例: https://openai.com/dall-e-2/
部分原因在於其逐漸新增/去除噪聲的性質,而不是像 GAN、VAE 或流那樣必須一次生成整張圖片。
當資料真的很嘈雜時,它不能正確地去噪所有的細節,所以它只學習大規模的結構。當資料的噪聲較小(t 較小)時,它可以擔心生成精細的細節而不關注結構的連貫性,因為此時影像的結構已經建立。
它就像畫肖像 :你首先畫出頭部形狀,然後新增眼睛鼻子和嘴巴,然後是睫毛和頭髮等等。第一次就很難做到,這就是為什麼像 DDPM 或 AR 模型這樣的多步模型總是更強大的原因。
它比 AR 模型(至少對於影像)更好的部分原因是它們不會引入歸納偏差,例如從左上角生成。此外,它可以在每一步自由更改整個影像,這與之前的條目在生成後都固定不變的 AR 模型不同,您只需在資料中新增一個新條目。
回到肖像示例,假設您開始繪製某人的臉,但在繪製他們的左眼時搞砸了。使用 AR 建模,您不能只是返回並擦除左眼,您所能做的就是繪製人臉的右下部分。
至於第2點:一篇論文解釋瞭如何在分類資料(文字)上使用擴散模型。還有一篇更新的論文與擴散模型(使用逐漸去噪)類似,效果很好。
相關文章
- 為什麼我如此討厭scrums? - RedditScrum
- 為什麼 Reddit 如此緩慢和不可靠? | HackerNews
- DiT:Transformers 與擴散模型強強聯手ORM模型
- 什麼是AI穩定擴散?AI
- 卷積為什麼如此強大?一文全解深度學習中的卷積卷積深度學習
- 國產App為什麼如此“臃腫”?!APP
- Python 為什麼如此設計?Python
- 為什麼Web3如此重要?Web
- AngularJS 為什麼如此火呢?AngularJS
- 怎麼理解今年 CV 比較火的擴散模型(DDPM)?模型
- 程式設計師,為什麼如此迷茫?程式設計師
- 為什麼JavaScript開發如此瘋狂JavaScript
- 為什麼Lisp語言如此先進?Lisp
- 為什麼我的 CV 模型不好用?沒想到原因竟如此簡單……模型
- 一文詳解擴散模型:DDPM模型
- 為什麼“敏捷”會浪費這麼多時間? - Reddit敏捷
- 什麼是大模型?大模型
- 雲同步: 什麼是雲同步以及為什麼它是如此重要?
- Redis為什麼是單執行緒?為什麼有如此高的效能?Redis執行緒
- 【BERT】你儲存的BERT模型為什麼那麼大?模型
- 為什麼GetHashCode方法需要如此設計?
- Windows如此普及,為什麼要學LinuxWindowsLinux
- 為什麼網路攻擊如此之多?
- 為什麼專案估算偏差如此之大?
- 為什麼格鬥遊戲如此老而彌堅?遊戲
- 什麼是 CI/CD? - reddit
- 為什麼Windows的相容性這麼強大,到底用了什麼技術?Windows
- 【diffusion】擴散模型詳解!理論+程式碼模型
- 谷歌的googLeNet卷積神經網路為什麼在計算機視覺領域如此強大?谷歌Go卷積神經網路計算機視覺
- 為什麼要學習大模型應用開發?大模型
- 為什麼GOPROXY對Golang開發如此重要Golang
- 譯文 | 為什麼軟體架構如此重要?架構
- 為什麼 Python 增長如此之快?Python
- 為什麼學習效率如此低,我很迷茫?
- 為什麼你的程式碼如此難以理解
- 為什麼開發者對Java 9如此的興奮Java
- 為什麼Lisp語言如此先進?(譯文)Lisp
- 羅傑斯的創新擴散模型(轉載)模型