Facebook 又出黑科技，手機照片一鍵切成 3D 大片

AIBigbull2050發表於2020-03-13

原文網址 : http://blog.itpub.net/69946223/viewspace-2680006/

2020-03-13 09:21

導語：CNN 網路還可以這樣用！

隨著科技的發展，現在人們可以隨時隨地用手機等裝置拍照記錄自己喜歡的瞬間。可能不少人都想過，假如出現一種黑科技，讓我們拍攝的平面 2D 照片變成立體的 3D 照片......

Facebook 也早就想到了這個問題。為改善使用者體驗，2018 年，Facebook 就推出了 3D 照片功能。這是一種全新的沉浸式格式，你可以用它與朋友、家人分享照片。但是，這項功能依賴於高階智慧手機才具備的雙鏡頭「肖像模式」功能，無法在尋常的移動裝置上使用。

為了讓更多人體驗到這種新的視覺格式，Facebook 利用機器學習開發了一個系統。這個系統可以推斷出任何影像的 3D 結構，任何裝置、任何時間拍攝的影像都可以被轉換成 3D 形式。這就可以讓人們輕鬆使用 3D 照片技術。

不僅如此，它還可以處理幾十年前的家庭照片和其它珍貴影像。任何擁有 iPhone7 及以上版本，或中端以上 Android 裝置的人，現在都可以在 Facebook 應用程式中嘗試這個功能。

Facebook 又出黑科技，手機照片一鍵切成 3D 大片

估計 2D 影像不同區域的深度，以建立 3D 影像

構建這種增強的 3D 圖片需要克服不少技術挑戰，例如，要訓練一個能夠正確推斷各種主題 3D 位置的模型，並優化系統，使其能夠在 1 秒鐘內執行在典型的移動處理器裝置上。為了克服這些挑戰，Facebook 在數百萬公共 3D 影像及其附帶的深度圖上訓練了卷積神經網路（CNN），並利用 Facebook AI 之前開發的各種移動優化技術，如 FBNet 和 ChamNet。團隊最近也討論了 3D 理解的相關研究。

現在，所有使用 Facebook 的人都可以使用這個功能，那麼，它究竟是如何構建的？我們可以一起來看看其中的技術細節。

Facebook 又出黑科技，手機照片一鍵切成 3D 大片

小狗的原始照片是用單鏡頭相機拍攝的，沒有任何深度圖資料，系統將其轉換成了上圖顯示的 3D 影像

在移動裝置上提供高效效能

給定一個標準的 RGB 影像，3D Photos CNN（3D 照片卷積神經網路）可以估計每個畫素與攝像機的距離。研究人員通過四種方式實現了這一目標：

使用一組可引數化、可移動優化的神經構建塊構建網路架構；
自動化架構搜尋，以找到這些塊的有效配置，使系統能夠在不到 1 秒鐘的時間內在各種裝置上執行任務；
量化感知訓練，在移動裝置上利用高效能 INT8 量化，同時使量化過程中的效能下降最小化；
從公開的 3D 照片獲取大量的訓練資料。

神經構建塊

Facebook 的架構使用受 FBNet 的構建塊啟發。FBNet 是一個為移動裝置等資源受限的裝置優化 ConvNet 架構的框架。一個構建塊由逐點卷積（pointwise convolution）、可選的上取樣、kxk 深度卷積和附加的點逐點卷積組成。Facebook 實現了一個 U-net 風格的架構，該架構已被修改為沿著跳過連線放置 FBNet 構建塊。U-net 編碼器和解碼器各包含 5 個階段，每個階段對應不同的空間解析度。

Facebook 又出黑科技，手機照片一鍵切成 3D 大片網路架構概述：一個 U-net 沿著跳過的連線放置額外的巨集級構建塊

自動化架構搜尋

為了找到一個有效的架構配置，Facebook AI 開發的 ChamNet 演算法自動完成搜尋過程。ChamNet 演算法不斷從搜尋空間中抽取點來訓練精度預測器。該精度預測器用於加速遺傳搜尋，以找到在滿足特定資源約束的情況下，使預測精度最大化的模型。

這個設定中使用了一個搜尋空間，它可以改變通道擴充套件因子和每個塊的輸出通道數，從而產生 3.4x1022 種可能的體系結構。然後，Facebook 使用 800 Tesla V100 GPU 在大約三天內完成搜尋，設定並調整模型架構上的 FLOP 約束，以實現不同的操作點。

量化感知訓練

預設情況下，其模型使用單精度浮點權值和啟用進行訓練，但研究人員發現，將權值和啟用量化為 8 位具有顯著的優勢。尤其是，int8 權重只需要 float32 權重所需儲存量的四分之一，從而減少首次使用時必須傳輸到裝置的位元組數。

Facebook 又出黑科技，手機照片一鍵切成 3D 大片

每幅影像都是從一個規則的 2D 影像開始，然後用深度估計神經網路轉換成 3D 影像

與基於 float32 的運算子相比，基於 Int8 的運算子的吞吐量也要高得多，這要歸功於 Facebook AI 的 QNNPACK 等經過優化的庫，後者已經整合到 PyTorch 中。我們使用量化感知訓練（QAT）來避免量化導致的質量下降。QAT 現在是 PyTorch 的一部分，它在訓練期間模擬量化並支援反向傳播，從而消除了訓練和生產效能之間的差距。

Facebook 又出黑科技，手機照片一鍵切成 3D 大片

神經網路處理各種內容，包括繪畫和複雜場景的影像

尋找創造 3D 體驗的新方法

除了改進深度估計演算法之外，研究人員還致力於為移動裝置拍攝的視訊提供高質量的深度估計。

由於每個幀的深度必須與下一幀一致，視訊處理技術具有一定挑戰性，但它也是一個提高效能的機會。對同一物體進行多次觀測，可以為高精度的深度估計提供額外的訊號。隨著 Facebook 神經網路效能的不斷提高，團隊還將探索在實時應用（如擴增實境）中利用深度估計、曲面法向估計和空間推理等技術。

除了這些潛在的新經驗，這項工作將幫助研究人員更好地理解 2D 影像的內容。更好地理解 3D 場景還可以幫助機器人導航以及與物理世界互動。Facebook 希望通過分享 3D 圖片系統的細節，幫助人工智慧社群在這些領域取得進展，並創造利用先進的 3D 新體驗。

via： https://ai.facebook.com/blog/-powered-by-ai-turning-any-2d-photo-into-3d-using-convolutional-neural-nets/

https://www.leiphone.com/news/202003/CVEKRbNuCKTGR5Xw.html

來自 “ ITPUB部落格 ” ，連結：http://blog.itpub.net/69946223/viewspace-2680006/，如需轉載，請註明出處，否則將追究法律責任。

美國軍方又出黑科技，實現用意念控制無人機
2018-03-06
無人機
Flutter黑科技一鍵開啟資原始檔
2020-04-17
Flutter
「黑科技」無人機殺手——無彈步槍DroneDefender
2018-03-06
無人機
揭秘京東搜尋黑科技：一鍵觸達億萬商品
2024-02-06
廣東未來科技AI立體拍攝手機Global3全新上市 3D視界一鍵開啟
2021-08-12
AI3D
鵝廠最新黑科技：兩分鐘一鍵遷移Github Pages
2021-07-23
Github
黑科技：LocalStorage 快取機制
2018-03-09
快取
黑袋子——一個擁有黑科技的APP
2021-11-30
APP
黑科技開戶神器黑科技開戶神器黑科技開戶神器黑科技開戶神器黑科技開戶神器
2024-05-07
一張照片獲得3D人體資訊，雲從科技提出新型DenseBody框架
2019-03-27
3D框架
手機照片怎麼傳到電腦手機照片傳到電腦的圖文教程
2022-09-28
黑鯊遊戲手機送福利：購買黑鯊遊戲手機送手柄
2018-06-17
遊戲
中國AI上演《尖峰時刻》：深蘭科技的一帶一路“大片”
2019-09-01
AI
手機照片怎麼傳到電腦上？手機照片傳到電腦上的三個方法
2019-12-12
手機抓包+注入黑科技HttpCanary——最強大的Android抓包注入工具
2018-12-23
HTTPPCAAndroid
安利一個自己搞的黑科技
2019-07-23
黑鯊遊戲手機Helo圖賞，黑鯊helo手機有哪些優缺點呢？
2018-10-25
遊戲
Facebook指控比基尼照片應用開發商洩露其機密檔案
2019-03-18
從“網路魔法”到“黑科技之年”：手機軟體新航道的開通時刻
2018-12-29
PIFuHD 讓照片秒變 3D 模型
2020-11-11
3D模型
iPhone刪除的照片能恢復嗎？蘋果手機照片怎麼恢復
2022-01-25
iPhone蘋果
索尼XZ2手機評測：索尼XZ2黑科技證言體驗才是王道
2018-06-09
Facebook人口第一大國，想掃描使用者所有的照片
2019-01-03
手機一鍵去水印的軟體有什麼
2019-04-10
分享行業“黑科技”
2018-06-05
行業
蘋果手機怎麼隱藏照片？蘋果iPhone XR/XS Max隱藏照片方法
2019-01-29
蘋果iPhone
【上傳一張照片，定製程式設計師科技感寫真】函式計算一鍵部署 PuLID for FLUX大模型
2024-10-23
程式設計師函式UX大模型
清華機試oj——手機按鍵
2018-05-26
四款支援3D人臉識別手機推薦 3D人臉識別手機有哪些
2018-07-30
3D
Android 隱藏手機鍵盤
2020-12-06
Android
Macos照片放大工具：Topaz Gigapixel AI for Mac 一鍵啟用
2023-11-13
MacAPIAI
一鍵AI著色，黑白老照片畫面瞬間鮮活
2022-01-12
AI
十分鐘搞懂手機號碼一鍵登入
2022-01-31
CSS3實現3d效果照片牆
2020-12-26
CSSS33D
win10系統下如何匯入iphone手機照片
2019-03-30
Win10iPhone
Python黑科技：FuckIt.py
2018-09-04
Python
javascript黑科技之高效填充
2021-09-09
JavaScript
1024！一張照片定製程式設計師科技感寫真
2024-10-31
程式設計師

Facebook 又出黑科技，手機照片一鍵切成 3D 大片

相關文章