英偉達新研究:“狗生貓,貓生萬物”的多模態無監督影像轉換
林鱗 編譯整理
量子位 出品 | 公眾號 QbitAI
英偉達最近的一項研究看起來有點神奇。
一張普通的貓咪影像,可以被轉換成一隻老虎、一頭獅子或一隻美洲豹。
還是一張普通的貓咪圖,還能被轉換成不同品種的狗。
這種實時轉換技術不僅能用於影像,還能用於視訊——
這是英偉達最新創造的一項技術。在最近釋出的論文Multimodal Unsupervised Image-to-Image Translation中,研究人員提出了一種多模態無監督的影像到影像(image to image)轉換框架。
這個框架的神奇之處在於,一張貓的影像可以同時轉換成多種動物,能夠進行一對多的影像轉換,打破了原來一對一轉換的限制。
△ “狗生貓,貓生萬物”
△ 冬夏場景轉換
此外,這個框架還支援使用者通過提供示例樣式的影像控制轉換輸出的風格。
這是一項有趣的技術,不僅能夠幫助遊戲開發者和電影製作者減少工作量和花費,還能讓自動駕駛領域更快、更容易地產生多樣化的訓練資料。
△ 道路的冬夏轉換
論文介紹
在論文Multimodal Unsupervised Image-to-Image Translation中,奈爾大學的Xun Huang、Serge Belongie聯合英偉達的Ming-Yu Liu與Jan Kautz提出了一種多模態無監督的影像到影像轉換問題的標準框架。
研究人員首先假設影像的潛在空間能夠分解為內容空間和樣式空間,之後再進一步假設,不同領域的影像內容空間相同,但樣式空間不同。
為了將一張影像轉換為指定領域的影像,研究人員在目標樣式空間中將影像的內容程式碼和隨機的樣式程式碼重新組合。這樣,內容程式碼編碼的資訊在轉換過程中將被保留,而樣式程式碼代表了與輸入影像無關的剩餘的變體。
通過抽取不同風格的程式碼,這個模型可以輸出風格多樣且多模態的影像。
實驗表明,這個模型在建立多模態輸出分佈時非常高效,並且和目前最先進的方法相比影像質量更高。
△ 與現有的樣式轉換模型的對比
這並不是英偉達在影像轉換領域的首次探索,這篇論文是在去年英偉達的NIPS論文Unsupervised Image-to-Image Translation Networks中提出的模型基礎上改進的。
相關資料
論文地址:
https://arxiv.org/abs/1804.04732
程式碼和預訓練模型獲取地址:
https://github.com/nvlabs/MUNIt
作者系網易新聞·網易號“各有態度”簽約作者
— 完 —
誠摯招聘
量子位正在招募編輯/記者,工作地點在北京中關村。期待有才氣、有熱情的同學加入我們!相關細節,請在量子位公眾號(QbitAI)對話介面,回覆“招聘”兩個字。
量子位 QbitAI · 頭條號簽約作者
վ'ᴗ' ի 追蹤AI技術和產品新動態
相關文章
- 英偉達又火了一篇影像轉換論文,我們竟然用來吸貓
- 機器學習是如何區分貓和狗的?機器學習
- 華為HMS的“生態雪球”,滾動在萬物智聯的新跑道
- 里斯本大學:新研究表明寵物狗或貓可能正在傳播致命的超級細菌
- 萬物互聯:物聯網帶來的生態協同
- 使用jupyter實現貓和狗的分類
- 基於多模態對抗學習的無監督時間序列異常檢測
- 聯通無線貓3G轉換WiFi是不是雞肋?薦WiFi
- JavaScript萬物產生順序JavaScript
- JavaScript世界萬物誕生記JavaScript
- 普渡大學:研究發現近一半的貓與狗一樣也喜歡主人和它們玩取物遊戲遊戲
- 貓咪動態查詢框架“倉庫貓”升級到0.5版框架
- 從多模態到泛化性,無監督學習如何成為人工智慧的下一站?人工智慧
- 雲端計算誕生“新物種” 樂視雲大視訊雲生態露真容
- 機器學習——監督學習&無監督學習機器學習
- 當前最好的詞句嵌入技術概覽:從無監督學習轉向監督、多工學習
- 江河湖泊生態水文監測物聯網解決方案
- 有監督學習和無監督學習
- 流浪貓流浪狗H5完整版程式原始碼H5原始碼
- Llama 3.2 Vision & Molmo:多模態開源生態系統基礎
- mongoose(貓鼬)Go
- 教程 | 用AI生成貓的圖片,擼貓人士必備AI
- 光纖貓怎麼連線無線路由器?光纖貓連線無線路由器的方法教程路由器
- 一圖看懂監督學習、無監督學習和半監督學習
- 【轉】Nosql生態系統SQL
- 如果程式設計師是貓,你是哪隻貓?程式設計師
- 如果程式設計師是貓 你是哪隻貓?程式設計師
- 電信光貓配置無線路由器路由器
- Php迅貓多使用者商城系統PHP
- 貓客頁面內元件的動態化方案-Tangram元件
- 貓樹詳解
- 物聯網路卡:智慧貓眼在家庭安防中的作用
- 什麼是有監督學習和無監督學習
- CurriculumNet:基於大規模網路影像的弱監督學習演算法演算法
- 300多篇相關研究,復旦、南洋理工最新多模態影像編輯綜述論文
- 無需成對示例、無監督訓練,CycleGAN生成影像簡直不要太簡單
- python 無監督生成模型Python模型
- 弱監督學習在醫學影像中的探索