綠幕通通扔掉 ੧ᐛ੭ | 谷歌AI實時「摳」背景

量子位發表於2018-03-02

原文網址 : https://blog.csdn.net/yh0vlde8vg8ep9vge/article/details/79428194

谷歌AI

原作 Valentin Bazarevsky & Andrei Tkachenka
Root 編譯自 Google Research Blog
量子位報導 | 公眾號 QbitAI

大場面的科幻動作片，拍攝過程肯定離不開綠幕。

640?wx_fmt=jpeg&wxfrom=5&wx_lazy=1

製作過程更加磨人。

摳綠+後期要做到完美（空間位置關係、光影關係），不僅要求細心，還得堆大量時間。

為了讓影視製作簡單點，谷歌研發出了可以在手機端就實時摳背景的工具（暫時沒名兒）。

這個實時摳背景的工具目前只出到Beta版，只在YouTube移動端上有。

640?wx_fmt=jpeg

△ 谷歌小哥哥戲精附體(´• ᵕ •`)*

這個技術，是用CNN（卷積神經網路）實現的。

這個神經網路框架，專為移動端設計。所以，在構建和訓練的過程中，谷歌給自己定了一些原則：

移動端的解決方案一定要足夠輕量，跑起來至少要比現有的最厲害的摳圖模型快個十倍，要30倍就更理想了；
為了最好的實時呈現效果，這個模型出的片必須達到30FPS（幀/秒）。

這個摳背景的模型，幀數的處理得很講究。

幀數不能太多，不然費算力，也無法及時出圖；但也不能太少，否則看起來卡頓。

資料集

為了訓練這個模型，谷歌標註了成千上萬個影像。

前景標出頭髮、眉毛、皮膚、眼鏡、鼻孔、嘴脣等。

640?wx_fmt=png

神經網路的輸入

谷歌的分離模型，是通過RGB通道計算出視訊源每幀的前景。

關鍵摳出來的前景前後兩幀之間要連貫。

現在的方法是用LSTM和GRU，對算力要求太高了，要用在移動端實時出片上不太現實。

LSTM，長短期記憶演算法，是一種時間遞迴神經網路。GRU，門控迴圈單元。

LSTM搭GRU，可以通過門控機制使迴圈神經網路，做到記憶過去的資訊，同時還能選擇性地忘記一些不重要的資訊而對長時間跨度的資訊的前後關係進行建模。

谷歌想到的解決辦法是，把上一幀已經算出來的蒙版（擋住背景用的）當作下一幀的第四個通道的資訊。這樣，就能節省算力，拿到的片子視覺上還滿足連貫介個要求。

640?wx_fmt=jpeg

△ 訓練流程：原始幀（左）；被分離成三個通道加上一幀的蒙版通道（中）；根據這四個通道資訊預測出這一幀的蒙版（右）

視訊裡摳背景，如果鏡頭裡前景物體劇變，比方說突然多了個人，前後幀的去背景效果就不連續了。

為了避免這個問題，保持視訊的流暢性，谷歌稍微改了一下標註的規則：

訓練模型先空杯（不把上一幀的蒙版當成已知的資訊），判斷出新闖進來的物體；
然後定義新進入物體以外的背景蒙版，小改動的話就調整上幀蒙版，大改動的話就拋棄上幀蒙版；
對當前幀做羽化處理，優化摳圖後的毛邊，模仿鏡頭在快速移動或旋轉時候的情境。

640?wx_fmt=jpeg

△ 小姐姐在試實時的摳圖效果

經過調整，谷歌訓練的模型表現炒雞好，在iPhone7上能實時出100多FPS的片，谷歌的Pixel2出40多FPS的高清片。

拿YouTube上stories頻道上的片試了試，摳背景效果都很流暢。摳圖效果也很棒棒，在驗證資料集上實現了94.8%的IOU（交疊率，在這裡就是摳背景效果貼不貼合）。

谷歌短期內想實現的目標是，用YouTube上stories頻道上的片子來測試優化這個摳背景技術。最後能成熟地用於未來的AR服務上。

最後，附編譯來源，
https://research.googleblog.com/2018/03/mobile-real-time-video-segmentation.html

你可能還感興趣：

MaskGAN：谷歌大腦讓AI學做完形填空

谷歌大腦提速1000倍的神經架構搜尋新方法

谷歌AI“你畫我猜”強推“狗年版本”

— 完 —

加入社群

量子位AI社群13群開始招募啦，歡迎對AI感興趣的同學，加小助手微信qbitbot5入群；

此外，量子位專業細分群(自動駕駛、CV、NLP、機器學習等)正在招募，面向正在從事相關領域的工程師及研究人員。

進群請加小助手微訊號qbitbot5，並務必備註相應群的關鍵詞~通過稽核後我們將邀請進群。（專業群稽核較嚴，敬請諒解）

誠摯招聘

量子位正在招募編輯/記者，工作地點在北京中關村。期待有才氣、有熱情的同學加入我們！相關細節，請在量子位公眾號(QbitAI)對話介面，回覆“招聘”兩個字。

量子位 QbitAI · 頭條號簽約作者

վ'ᴗ' ի 追蹤AI技術和產品新動態

canvas畫素點操作 —— 視訊綠幕摳圖
2019-02-27
Canvas
使用RMBG-1.4進行摳圖（背景移除）
2024-08-28
是時候扔掉 Postman 了，Apifox 真香！
2021-08-01
PostmanAPI
ps教程之使用通道摳圖換背景色
2021-09-11
是時候扔掉cmder，換上Windows Terminal
2020-05-30
Windows
不懼繁雜背景，影片編輯服務一鍵實現人像摳圖
2022-09-14
PaddlePaddle : AI摳圖及圖片合成
2020-01-18
AI
python利用蒙版進行摳圖，背景透明和前景透明
2024-06-14
Python
美顏SDK的背景摳圖技術您瞭解嗎？
2022-05-28
智慧榕城|綠盟科技助力落實數字化轉型時代背景下的網路安全管理
2020-09-19
【Python案例】用某度AI介面實現摳圖並改圖片底色
2022-09-22
PythonAI
win10 office背景怎麼設定成綠色_win10 office背景色如何變綠
2020-04-09
Win10
win10怎麼設定不同螢幕背景_win10設定不同螢幕背景操作方法
2020-08-07
Win10
你們要的日文AI實時字幕來了，谷歌瀏覽器VS小白瀏覽器AI大比拼
2020-11-23
AI谷歌瀏覽器
只需五秒！一鍵自動智慧摳圖，換背景就是這麼簡單！
2021-12-16
人工智慧AI摳圖Topaz Mask AI 可以幫助我們做到什麼
2020-12-15
人工智慧AI
Python實時爬取鬥魚彈幕
2019-01-22
Python
又有新框架上線了，測試、AI 通通有「GitHub 熱點速覽」
2023-12-11
框架AIGithub
mac摳圖軟體推薦：Topaz Mask AI mac版
2021-02-05
MacAI
直播商城原始碼，響應式的全螢幕背景圖（主介面背景圖）
2022-02-18
原始碼
是時候扔掉 Postman 了，試試 IntelliJ IDEA 自帶的高能神器！
2019-12-21
PostmanIntelliJIdea
別再自己摳圖了，Python用5行程式碼實現批量摳圖
2020-04-14
Python行程
設定背景圖片鋪滿整個螢幕
2019-02-14
綠色產能綠色時尚
2022-05-13
在Android用vulkan完成藍綠幕扣像
2021-02-07
Android
AI已進入谷歌圖片
2024-03-26
AI谷歌
AI已進入谷歌地圖
2024-03-25
AI谷歌地圖
如何實現一鍵線上自動摳圖？
2022-07-27
win10怎樣把word背景色調成綠色_win10系統下word背景顏色怎麼變為綠色
2020-04-09
Win10
是時候扔掉Prometheus了,VictoriaMetrics全家桶入門與K8S部署
2024-11-03
PrometheusK8S
ps摳圖教程之半透明婚紗摳取
2021-09-11
SpringBoot實現Excel匯入匯出，好用到爆，POI可以扔掉了！
2021-10-27
Spring BootExcel
綠盟科技阿里雲旗艦店正式開幕
2018-05-22
阿里
美顏SDK人像摳圖技術是什麼？人像摳圖技術是如何實現的？
2022-10-26
win10 如何設定txt背景綠色 win10如何在txt文件修改背景顏色
2020-09-16
Win10
直播時各種背景是怎麼實現的？聊一聊虛擬背景背後的技術
2021-08-11
大螢幕實時資料視覺化解決方案?
2020-09-30
視覺化
谷歌AI大轉向：鯨吞DeepMind健康部門，在印度成立首個AI實驗室
2019-11-08
谷歌AI

綠幕通通扔掉 ੧ᐛ੭ | 谷歌AI實時「摳」背景

原作 Valentin Bazarevsky & Andrei TkachenkaRoot 編譯自 Google Research Blog量子位 報導 | 公眾號 QbitAI

△ 谷歌小哥哥戲精附體(´• ᵕ •`)*

資料集

神經網路的輸入

△ 訓練流程：原始幀（左）；被分離成三個通道加上一幀的蒙版通道（中）；根據這四個通道資訊預測出這一幀的蒙版（右）

△ 小姐姐在試實時的摳圖效果

相關文章

原作 Valentin Bazarevsky & Andrei Tkachenka
Root 編譯自 Google Research Blog
量子位報導 | 公眾號 QbitAI