綠幕通通扔掉 ੧ᐛ੭ | 谷歌AI實時「摳」背景
原作 Valentin Bazarevsky & Andrei Tkachenka
Root 編譯自 Google Research Blog
量子位 報導 | 公眾號 QbitAI
大場面的科幻動作片,拍攝過程肯定離不開綠幕。
製作過程更加磨人。
摳綠+後期要做到完美(空間位置關係、光影關係),不僅要求細心,還得堆大量時間。
為了讓影視製作簡單點,谷歌研發出了可以在手機端就實時摳背景的工具(暫時沒名兒)。
這個實時摳背景的工具目前只出到Beta版,只在YouTube移動端上有。
△ 谷歌小哥哥戲精附體(´• ᵕ •`)*
這個技術,是用CNN(卷積神經網路)實現的。
這個神經網路框架,專為移動端設計。所以,在構建和訓練的過程中,谷歌給自己定了一些原則:
移動端的解決方案一定要足夠輕量,跑起來至少要比現有的最厲害的摳圖模型快個十倍,要30倍就更理想了;
為了最好的實時呈現效果,這個模型出的片必須達到30FPS(幀/秒)。
這個摳背景的模型,幀數的處理得很講究。
幀數不能太多,不然費算力,也無法及時出圖;但也不能太少,否則看起來卡頓。
資料集
為了訓練這個模型,谷歌標註了成千上萬個影像。
前景標出頭髮、眉毛、皮膚、眼鏡、鼻孔、嘴脣等。
神經網路的輸入
谷歌的分離模型,是通過RGB通道計算出視訊源每幀的前景。
關鍵摳出來的前景前後兩幀之間要連貫。
現在的方法是用LSTM和GRU,對算力要求太高了,要用在移動端實時出片上不太現實。
LSTM,長短期記憶演算法,是一種時間遞迴神經網路。GRU,門控迴圈單元。
LSTM搭GRU,可以通過門控機制使迴圈神經網路,做到記憶過去的資訊,同時還能選擇性地忘記一些不重要的資訊而對長時間跨度的資訊的前後關係進行建模。
谷歌想到的解決辦法是,把上一幀已經算出來的蒙版(擋住背景用的)當作下一幀的第四個通道的資訊。這樣,就能節省算力,拿到的片子視覺上還滿足連貫介個要求。
△ 訓練流程:原始幀(左);被分離成三個通道加上一幀的蒙版通道(中);根據這四個通道資訊預測出這一幀的蒙版(右)
視訊裡摳背景,如果鏡頭裡前景物體劇變,比方說突然多了個人,前後幀的去背景效果就不連續了。
為了避免這個問題,保持視訊的流暢性,谷歌稍微改了一下標註的規則:
訓練模型先空杯(不把上一幀的蒙版當成已知的資訊),判斷出新闖進來的物體;
然後定義新進入物體以外的背景蒙版,小改動的話就調整上幀蒙版,大改動的話就拋棄上幀蒙版;
對當前幀做羽化處理,優化摳圖後的毛邊,模仿鏡頭在快速移動或旋轉時候的情境。
△ 小姐姐在試實時的摳圖效果
經過調整,谷歌訓練的模型表現炒雞好,在iPhone7上能實時出100多FPS的片,谷歌的Pixel2出40多FPS的高清片。
拿YouTube上stories頻道上的片試了試,摳背景效果都很流暢。摳圖效果也很棒棒,在驗證資料集上實現了94.8%的IOU(交疊率,在這裡就是摳背景效果貼不貼合)。
谷歌短期內想實現的目標是,用YouTube上stories頻道上的片子來測試優化這個摳背景技術。最後能成熟地用於未來的AR服務上。
最後,附編譯來源,
https://research.googleblog.com/2018/03/mobile-real-time-video-segmentation.html
你可能還感興趣:
— 完 —
加入社群
量子位AI社群13群開始招募啦,歡迎對AI感興趣的同學,加小助手微信qbitbot5入群;
此外,量子位專業細分群(自動駕駛、CV、NLP、機器學習等)正在招募,面向正在從事相關領域的工程師及研究人員。
進群請加小助手微訊號qbitbot5,並務必備註相應群的關鍵詞~通過稽核後我們將邀請進群。(專業群稽核較嚴,敬請諒解)
誠摯招聘
量子位正在招募編輯/記者,工作地點在北京中關村。期待有才氣、有熱情的同學加入我們!相關細節,請在量子位公眾號(QbitAI)對話介面,回覆“招聘”兩個字。
量子位 QbitAI · 頭條號簽約作者
վ'ᴗ' ի 追蹤AI技術和產品新動態
相關文章
- canvas畫素點操作 —— 視訊綠幕摳圖Canvas
- 使用RMBG-1.4進行摳圖(背景移除)
- 是時候扔掉 Postman 了,Apifox 真香!PostmanAPI
- ps教程之使用通道摳圖換背景色
- 是時候扔掉cmder, 換上Windows TerminalWindows
- 不懼繁雜背景,影片編輯服務一鍵實現人像摳圖
- PaddlePaddle : AI摳圖及圖片合成AI
- python利用蒙版進行摳圖,背景透明和前景透明Python
- 美顏SDK的背景摳圖技術您瞭解嗎?
- 智慧榕城|綠盟科技助力落實數字化轉型時代背景下的網路安全管理
- 【Python案例】用某度AI介面實現摳圖並改圖片底色PythonAI
- win10 office背景怎麼設定成綠色_win10 office背景色如何變綠Win10
- win10怎麼設定不同螢幕背景_win10設定不同螢幕背景操作方法Win10
- 你們要的日文AI實時字幕來了,谷歌瀏覽器VS小白瀏覽器AI大比拼AI谷歌瀏覽器
- 人工智慧AI摳圖Topaz Mask AI 可以幫助我們做到什麼人工智慧AI
- 只需五秒!一鍵自動智慧摳圖,換背景就是這麼簡單!
- Python實時爬取鬥魚彈幕Python
- 又有新框架上線了,測試、AI 通通有「GitHub 熱點速覽」框架AIGithub
- mac摳圖軟體推薦:Topaz Mask AI mac版MacAI
- 直播商城原始碼,響應式的全螢幕背景圖(主介面背景圖)原始碼
- 是時候扔掉 Postman 了,試試 IntelliJ IDEA 自帶的高能神器!PostmanIntelliJIdea
- 別再自己摳圖了,Python用5行程式碼實現批量摳圖Python行程
- 設定背景圖片鋪滿整個螢幕
- 綠色產能綠色時尚
- 在Android用vulkan完成藍綠幕扣像Android
- AI已進入谷歌圖片AI谷歌
- AI已進入谷歌地圖AI谷歌地圖
- 如何實現一鍵線上自動摳圖?
- win10怎樣把word背景色調成綠色_win10系統下word背景顏色怎麼變為綠色Win10
- 是時候扔掉Prometheus了,VictoriaMetrics全家桶入門與K8S部署PrometheusK8S
- ps摳圖教程之半透明婚紗摳取
- SpringBoot實現Excel匯入匯出,好用到爆,POI可以扔掉了!Spring BootExcel
- 綠盟科技阿里雲旗艦店正式開幕阿里
- 美顏SDK人像摳圖技術是什麼?人像摳圖技術是如何實現的?
- win10 如何設定txt背景綠色 win10如何在txt文件修改背景顏色Win10
- 谷歌AI大轉向:鯨吞DeepMind健康部門,在印度成立首個AI實驗室谷歌AI
- 直播時各種背景是怎麼實現的?聊一聊虛擬背景背後的技術
- 大螢幕實時資料視覺化解決方案?視覺化