為什麼擴散diffution模型如此強大? - Reddit
可以在這裡看到200行程式碼,但它背後的數學是如此簡單,這演算法智慧且簡單,但它的生成結果似乎比 GAN 更令人難以置信,而且它的速度很快,模型大小也不算大。
案例: https://openai.com/dall-e-2/
部分原因在於其逐漸新增/去除噪聲的性質,而不是像 GAN、VAE 或流那樣必須一次生成整張圖片。
當資料真的很嘈雜時,它不能正確地去噪所有的細節,所以它只學習大規模的結構。當資料的噪聲較小(t 較小)時,它可以擔心生成精細的細節而不關注結構的連貫性,因為此時影像的結構已經建立。
它就像畫肖像 :你首先畫出頭部形狀,然後新增眼睛鼻子和嘴巴,然後是睫毛和頭髮等等。第一次就很難做到,這就是為什麼像 DDPM 或 AR 模型這樣的多步模型總是更強大的原因。
它比 AR 模型(至少對於影像)更好的部分原因是它們不會引入歸納偏差,例如從左上角生成。此外,它可以在每一步自由更改整個影像,這與之前的條目在生成後都固定不變的 AR 模型不同,您只需在資料中新增一個新條目。
回到肖像示例,假設您開始繪製某人的臉,但在繪製他們的左眼時搞砸了。使用 AR 建模,您不能只是返回並擦除左眼,您所能做的就是繪製人臉的右下部分。
至於第2點:一篇論文解釋瞭如何在分類資料(文字)上使用擴散模型。還有一篇更新的論文與擴散模型(使用逐漸去噪)類似,效果很好。
相關文章
- 為什麼我如此討厭scrums? - RedditScrum
- 為什麼 Reddit 如此緩慢和不可靠? | HackerNews
- DiT:Transformers 與擴散模型強強聯手ORM模型
- 什麼是AI穩定擴散?AI
- Python 為什麼如此設計?Python
- 卷積為什麼如此強大?一文全解深度學習中的卷積卷積深度學習
- 豐田精益生產方式為什麼如此強調現場?
- 為什麼Web3如此重要?Web
- 為什麼 Dapr 如此令人興奮
- 怎麼理解今年 CV 比較火的擴散模型(DDPM)?模型
- 一文詳解擴散模型:DDPM模型
- 回首 Kubernetes 發展,為什麼如此出色?
- 為什麼Kubernetes如此受歡迎? -stackoverflow
- 為什麼GetHashCode方法需要如此設計?
- Windows如此普及,為什麼要學LinuxWindowsLinux
- 國產App為什麼如此“臃腫”?!APP
- 程式設計師,為什麼如此迷茫?程式設計師
- 為什麼我的 CV 模型不好用?沒想到原因竟如此簡單……模型
- 為什麼“敏捷”會浪費這麼多時間? - Reddit敏捷
- 谷歌的googLeNet卷積神經網路為什麼在計算機視覺領域如此強大?谷歌Go卷積神經網路計算機視覺
- 什麼是 CI/CD? - reddit
- 【diffusion】擴散模型詳解!理論+程式碼模型
- 什麼是大模型?大模型
- 雲同步: 什麼是雲同步以及為什麼它是如此重要?
- 值得你花時間看的擴散模型教程,來自普渡大學模型
- 為什麼GOPROXY對Golang開發如此重要Golang
- 為什麼魂系列的敘事如此迷人?
- 為什麼Kubernetes的儲存如此艱難?
- Redis為什麼是單執行緒?為什麼有如此高的效能?Redis執行緒
- DELL G3為什麼如此豪橫?大爆點震撼揭祕
- 【BERT】你儲存的BERT模型為什麼那麼大?模型
- 擴散模型 (Diffusion Model) 之最全詳解圖解模型圖解
- 為什麼要學習大模型應用開發?大模型
- 為什麼Windows的相容性這麼強大,到底用了什麼技術?Windows
- 悲劇的我啊,為什麼如此悲劇
- 譯文 | 為什麼軟體架構如此重要?架構
- 為什麼async/await關鍵字是如此重要AI
- 擴散模型中的後驗分佈方差推導模型