Facebook 又出黑科技,手機照片一鍵切成 3D 大片
2020-03-13 09:21 |
隨著科技的發展,現在人們可以隨時隨地用手機等裝置拍照記錄自己喜歡的瞬間。可能不少人都想過,假如出現一種黑科技,讓我們拍攝的平面 2D 照片變成立體的 3D 照片......
Facebook 也早就想到了這個問題。為改善使用者體驗,2018 年,Facebook 就推出了 3D 照片功能。這是一種全新的沉浸式格式,你可以用它與朋友、家人分享照片。但是,這項功能依賴於高階智慧手機才具備的雙鏡頭「肖像模式」功能,無法在尋常的移動裝置上使用。
為了讓更多人體驗到這種新的視覺格式,Facebook 利用機器學習開發了一個系統。這個系統可以推斷出任何影像的 3D 結構,任何裝置、任何時間拍攝的影像都可以被轉換成 3D 形式。這就可以讓人們輕鬆使用 3D 照片技術。
不僅如此,它還可以處理幾十年前的家庭照片和其它珍貴影像。任何擁有 iPhone7 及以上版本,或中端以上 Android 裝置的人,現在都可以在 Facebook 應用程式中嘗試這個功能。
估計 2D 影像不同區域的深度,以建立 3D 影像
構建這種增強的 3D 圖片需要克服不少技術挑戰,例如,要訓練一個能夠正確推斷各種主題 3D 位置的模型,並最佳化系統,使其能夠在 1 秒鐘內執行在典型的移動處理器裝置上。為了克服這些挑戰,Facebook 在數百萬公共 3D 影像及其附帶的深度圖上訓練了卷積神經網路(CNN),並利用 Facebook AI 之前開發的各種移動最佳化技術,如 FBNet 和 ChamNet。團隊最近也討論了 3D 理解的 相關研究。
現在,所有使用 Facebook 的人都可以使用這個功能,那麼,它究竟是如何構建的?我們可以一起來看看其中的技術細節。
小狗的原始照片是用單鏡頭相機拍攝的,沒有任何深度圖資料,系統將其轉換成了上圖顯示的 3D 影像
在移動裝置上提供高效效能
給定一個標準的 RGB 影像,3D Photos CNN(3D 照片卷積神經網路)可以估計每個畫素與攝像機的距離。研究人員透過四種方式實現了這一目標:
-
使用一組可引數化、可移動最佳化的神經構建塊構建網路架構;
-
自動化架構搜尋,以找到這些塊的有效配置,使系統能夠在不到 1 秒鐘的時間內在各種裝置上執行任務;
-
量化感知訓練,在移動裝置上利用高效能 INT8 量化,同時使量化過程中的效能下降最小化;
-
從公開的 3D 照片獲取大量的訓練資料。
神經構建塊
Facebook 的架構使用受 FBNet 的構建塊啟發。FBNet 是一個為移動裝置等資源受限的裝置最佳化 ConvNet 架構的框架。一個構建塊由逐點卷積(pointwise convolution)、可選的上取樣、kxk 深度卷積和附加的點逐點卷積組成。Facebook 實現了一個 U-net 風格的架構,該架構已被修改為沿著跳過連線放置 FBNet 構建塊。U-net 編碼器和解碼器各包含 5 個階段,每個階段對應不同的空間解析度。
網路架構概述:一個 U-net 沿著跳過的連線放置額外的宏級構建塊
自動化架構搜尋
為了找到一個有效的架構配置,Facebook AI 開發的 ChamNet 演算法自動完成搜尋過程。ChamNet 演算法不斷從搜尋空間中抽取點來訓練精度預測器。該精度預測器用於加速遺傳搜尋,以找到在滿足特定資源約束的情況下,使預測精度最大化的模型。
這個設定中使用了一個搜尋空間,它可以改變通道擴充套件因子和每個塊的輸出通道數,從而產生 3.4x1022 種可能的體系結構。然後,Facebook 使用 800 Tesla V100 GPU 在大約三天內完成搜尋,設定並調整模型架構上的 FLOP 約束,以實現不同的操作點。
量化感知訓練
預設情況下,其模型使用單精度浮點權值和啟用進行訓練,但研究人員發現,將權值和啟用量化為 8 位具有顯著的優勢。尤其是,int8 權重只需要 float32 權重所需儲存量的四分之一,從而減少首次使用時必須傳輸到裝置的位元組數。
每幅影像都是從一個規則的 2D 影像開始,然後用深度估計神經網路轉換成 3D 影像
與基於 float32 的運算子相比,基於 Int8 的運算子的吞吐量也要高得多,這要歸功於 Facebook AI 的 QNNPACK 等經過最佳化的庫,後者已經整合到 PyTorch 中。我們使用量化感知訓練(QAT)來避免量化導致的質量下降。QAT 現在是 PyTorch 的一部分,它在訓練期間模擬量化並支援反向傳播,從而消除了訓練和生產效能之間的差距。
神經網路處理各種內容,包括繪畫和複雜場景的影像
尋找創造 3D 體驗的新方法
除了改進深度估計演算法之外,研究人員還致力於為移動裝置拍攝的影片提供高質量的深度估計。
由於每個幀的深度必須與下一幀一致,影片處理技術具有一定挑戰性,但它也是一個提高效能的機會。對同一物體進行多次觀測,可以為高精度的深度估計提供額外的訊號。隨著 Facebook 神經網路效能的不斷提高,團隊還將探索在實時應用(如擴增實境)中利用深度估計、曲面法向估計和空間推理等技術。
除了這些潛在的新經驗,這項工作將幫助研究人員更好地理解 2D 影像的內容。更好地理解 3D 場景還可以幫助機器人導航以及與物理世界互動。Facebook 希望透過分享 3D 圖片系統的細節,幫助人工智慧社群在這些領域取得進展,並創造利用先進的 3D 新體驗。
來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/69946223/viewspace-2680006/,如需轉載,請註明出處,否則將追究法律責任。
相關文章
- FaceBook研究人腦黑科技 腦機藉口即將破解
- 美國軍方又出黑科技,實現用意念控制無人機無人機
- Flutter黑科技一鍵開啟資原始檔Flutter
- 廣東未來科技AI立體拍攝手機Global3全新上市 3D視界一鍵開啟AI3D
- 黑科技:LocalStorage 快取機制快取
- 鵝廠最新黑科技:兩分鐘一鍵遷移Github PagesGithub
- 黑科技開戶神器黑科技開戶神器黑科技開戶神器黑科技開戶神器黑科技開戶神器
- iPhone安全性下降:一張照片可以操控你手機 照片鑽廣告iPhone
- 「黑科技」無人機殺手——無彈步槍DroneDefender無人機
- 黑袋子——一個擁有黑科技的APPAPP
- 黑鯊遊戲手機送福利:購買黑鯊遊戲手機送手柄遊戲
- 美圖M8手機正式釋出:“美顏拍照黑科技”
- 一張照片獲得3D人體資訊,雲從科技提出新型DenseBody框架3D框架
- 手機照片怎麼傳到電腦 手機照片傳到電腦的圖文教程
- 中國AI上演《尖峰時刻》:深蘭科技的一帶一路“大片”AI
- 黑鯊遊戲手機Helo圖賞,黑鯊helo手機有哪些優缺點呢?遊戲
- 手機抓包+注入黑科技HttpCanary——最強大的Android抓包注入工具HTTPPCAAndroid
- 從“網路魔法”到“黑科技之年”:手機軟體新航道的開通時刻
- DreamGrip看起來挺複雜 但能讓手機攝影拍出大片的效果
- 觸控式螢幕一體機Surface Studio 微軟的新型黑科技微軟
- 索尼XZ2手機評測:索尼XZ2黑科技證言 體驗才是王道
- 蘋果手機怎麼隱藏照片?蘋果iPhone XR/XS Max隱藏照片方法蘋果iPhone
- iPhone刪除的照片能恢復嗎?蘋果手機照片怎麼恢復iPhone蘋果
- 分享行業“黑科技”行業
- 蘋果手機使用技巧:如何一鍵去“相簿”底部蘋果
- 蘋果手機也爆炸了 現場照片嚇人!蘋果
- CNN:Facebook需推出應用商店而非手機CNN
- PIFuHD 讓照片秒變 3D 模型3D模型
- Facebook收購whatsapp的真正原因:有照片APP
- iPhone 7最新照片曝光 深空黑配色消失iPhone
- Baird Equity Research:消費者對亞馬遜智慧手機比Facebook手機更期待AIUI亞馬遜
- 蘋果MacBook Pro又出問題 這次是鍵盤!蘋果Mac
- Oracle壓縮黑科技(一)—基礎表壓縮Oracle
- 手機一鍵去水印的軟體有什麼
- 按建立日期批量整理手機中匯出的照片
- 黑鯊遊戲手機2 Pro正式釋出,再一次引領遊戲手機行業升級遊戲行業
- javascript黑科技之高效填充JavaScript
- 幾個CSS的黑科技CSS