英偉達新研究：“狗生貓，貓生萬物”的多模態無監督影像轉換

量子位發表於2018-04-18

原文網址 : https://blog.csdn.net/yh0vlde8vg8ep9vge/article/details/79987781

林鱗編譯整理
量子位出品 | 公眾號 QbitAI

英偉達最近的一項研究看起來有點神奇。

一張普通的貓咪影像，可以被轉換成一隻老虎、一頭獅子或一隻美洲豹。

640?wx_fmt=png&wxfrom=5&wx_lazy=1
還是一張普通的貓咪圖，還能被轉換成不同品種的狗。

640?wx_fmt=png&wxfrom=5&wx_lazy=1
這種實時轉換技術不僅能用於影像，還能用於視訊——

這是英偉達最新創造的一項技術。在最近釋出的論文Multimodal Unsupervised Image-to-Image Translation中，研究人員提出了一種多模態無監督的影像到影像（image to image）轉換框架。

這個框架的神奇之處在於，一張貓的影像可以同時轉換成多種動物，能夠進行一對多的影像轉換，打破了原來一對一轉換的限制。

640?wx_fmt=png △ “狗生貓，貓生萬物”

640?wx_fmt=png △ 冬夏場景轉換

此外，這個框架還支援使用者通過提供示例樣式的影像控制轉換輸出的風格。
640?wx_fmt=png
這是一項有趣的技術，不僅能夠幫助遊戲開發者和電影製作者減少工作量和花費，還能讓自動駕駛領域更快、更容易地產生多樣化的訓練資料。

640?wx_fmt=png △ 道路的冬夏轉換

論文介紹

在論文Multimodal Unsupervised Image-to-Image Translation中，奈爾大學的Xun Huang、Serge Belongie聯合英偉達的Ming-Yu Liu與Jan Kautz提出了一種多模態無監督的影像到影像轉換問題的標準框架。

研究人員首先假設影像的潛在空間能夠分解為內容空間和樣式空間，之後再進一步假設，不同領域的影像內容空間相同，但樣式空間不同。

640?wx_fmt=png

為了將一張影像轉換為指定領域的影像，研究人員在目標樣式空間中將影像的內容程式碼和隨機的樣式程式碼重新組合。這樣，內容程式碼編碼的資訊在轉換過程中將被保留，而樣式程式碼代表了與輸入影像無關的剩餘的變體。

640?wx_fmt=png

通過抽取不同風格的程式碼，這個模型可以輸出風格多樣且多模態的影像。

實驗表明，這個模型在建立多模態輸出分佈時非常高效，並且和目前最先進的方法相比影像質量更高。

640?wx_fmt=png △ 與現有的樣式轉換模型的對比

這並不是英偉達在影像轉換領域的首次探索，這篇論文是在去年英偉達的NIPS論文Unsupervised Image-to-Image Translation Networks中提出的模型基礎上改進的。

相關資料

論文地址：

https://arxiv.org/abs/1804.04732

程式碼和預訓練模型獲取地址：

https://github.com/nvlabs/MUNIt

作者系網易新聞·網易號“各有態度”簽約作者

— 完 —

誠摯招聘

量子位正在招募編輯/記者，工作地點在北京中關村。期待有才氣、有熱情的同學加入我們！相關細節，請在量子位公眾號(QbitAI)對話介面，回覆“招聘”兩個字。

量子位 QbitAI · 頭條號簽約作者

վ'ᴗ' ի 追蹤AI技術和產品新動態

英偉達又火了一篇影像轉換論文，我們竟然用來吸貓
2019-05-10
狗不吃貓糧
2018-03-27
里斯本大學：新研究表明寵物狗或貓可能正在傳播致命的超級細菌
2024-04-16
阿里健康研究院：2021天貓養生趨勢新洞察（附下載）
2021-11-25
阿里
阿里健康研究院：2021天貓養生趨勢新洞察報告全文
2021-06-16
阿里
貓狗識別訓練
2020-12-01
有英偉達新卡的安裝
2024-04-14
基於多模態對抗學習的無監督時間序列異常檢測
2022-08-04
華為HMS的“生態雪球”，滾動在萬物智聯的新跑道
2020-09-17
世界上最受歡迎的寵物到底是狗還是貓？
2022-12-16
Nature子刊，香港浸大、英偉達團隊多模態深度語言模型，用於複雜的宏基因組研究
2024-10-15
模型
使用jupyter實現貓和狗的分類
2018-12-12
優秀畢業生寄語：飛翔的貓咪
2022-08-29
央視財經：2021年中國飼養犬貓人群數量達到6844萬人養貓人群比例超過養狗人群
2022-07-11
【ML吳恩達】3 有監督學習和無監督學習
2020-11-19
吳恩達
5.AlexNet貓狗分類（Lightning框架）
2024-06-27
框架
基於Pytorch實現貓狗分類
2021-06-08
PyTorch
深度學習（二）之貓狗分類
2022-03-20
深度學習
當前最好的詞句嵌入技術概覽：從無監督學習轉向監督、多工學習
2018-06-08
從多模態到泛化性，無監督學習如何成為人工智慧的下一站？
2020-09-03
人工智慧
CVPR 2019 | 無監督領域特定單影像去模糊
2019-03-21
幽默：為什麼人工智慧比不上貓狗？
2021-12-21
人工智慧
影像轉換3D模型只需5行程式碼，英偉達推出3D深度學習工具Kaolin
2019-11-16
3D模型行程深度學習
機器學習是如何區分貓和狗的？
2019-03-14
機器學習
天貓價值白皮書：從服務領先到生態繁榮（附下載）
2023-09-20
2萬多億美元，英偉達市值創新高，華爾街排第三
2024-03-04
1.2萬億電晶體，史上最強AI晶片誕生：英偉達Titan V的57倍
2019-08-22
AI晶片
JavaScript萬物產生順序
2018-11-01
JavaScript
江河湖泊生態水文監測物聯網解決方案
2024-01-04
花椒推出PC端直播產品“貓啵”，雙端發力打造更完整直播生態
2018-05-30
ResNet50的貓狗分類訓練及預測
2023-04-12
按照時序監控英偉達顯示卡的利用率
2023-02-23
普渡大學：研究發現近一半的貓與狗一樣也喜歡主人和它們玩取物遊戲
2024-09-05
遊戲
英偉達的AI晶片霸主之路！
2019-11-25
AI晶片
鏟屎官圓夢！模擬經營養貓手遊《貓貓咖啡屋》正式上線！
2021-04-16
Llama 3.2 Vision & Molmo：多模態開源生態系統基礎
2024-11-01
一圖看懂監督學習、無監督學習和半監督學習
2020-02-18
TensorFlow 卷積神經網路之貓狗識別
2021-09-09
卷積神經網路

英偉達新研究：“狗生貓，貓生萬物”的多模態無監督影像轉換

林鱗 編譯整理量子位 出品 | 公眾號 QbitAI

論文介紹

相關資料

作者系網易新聞·網易號“各有態度”簽約作者

相關文章

林鱗編譯整理
量子位出品 | 公眾號 QbitAI