視訊操縱中的新AI技術轉向

dicksonjyl560101發表於2018-10-03

原文網址 : http://blog.itpub.net/29829936/viewspace-2215410/

視訊操縱中的新AI技術為“talking head”這一表達賦予了新的含義。在今年的美國SIGGRAPH盛會上，一個國際研究小組展示了一項名為Deep Video Portraits（深度視訊肖像）的新專案，向我們展示了面部表情合成的最新進展。

Deep Video Portraits專案依靠一種被稱為生成式對抗網路（GAN）的AI技術，可以實現目標視訊在源視訊的基礎上重新動畫。與僅限於面部表情操作的方法相比，該專案將完整的3D頭部位置、頭部旋轉、面部表情以及眼部細節從源參與者轉移到目標參與者。顧名思義，GAN將兩個完全對立的神經網路互相對撞，創造出一個真實的“人的腦袋”。通過自由重組源和目標引數，研發人員能夠演示各種各樣的視訊重寫，而無需明確的模擬頭髮、身體和背景。

簡單的理解就是：一個神經網路生成內容，另一個神經網路對內容進行處理，然後兩者相互作用產生一個現實的結果。它可以複製靜態的背景，然後實現人物頭部動畫，並且經過測試，最終效果完全能夠矇蔽人眼。

研究人員表示，該項技術有很大的應用潛力，有很多的創造性應用。其中一個重要的應用就是影視行業的後期製作。一段視訊拍攝完之後都需要經過後期的剪輯，一般需要調整演員的頭部或者面部表情的定位以便更好的匹配場景的預期框架。因為視訊是動態的，幾秒鐘的面部微表情調整就要修改數百幀的畫面，即便是專業的後期工作者也需要很長的修改時間。Deep Video Portraits的演算法技術就完全可以簡化這一程式，通過它可以調整任一時間段的面目表情或者修改拍攝片段的構圖錯誤等問題。

巴斯大學（University of Bath）運動捕捉研究中心的Christian Richardt在一份新聞稿中說到：“Deep Video Portraits可以在毫不費力的情況下就能產生真實的視覺效果。通過該項技術，演員的頭部和他們的面部表情可以輕鬆被編輯，巧妙的改變整個場景框架，實現完美的故事情節。”

AI 技術並非“Deepfakes”！

Deep Video Portraits並不是第一個使用人工智慧操作視訊和音訊的專案。在去年的SIGGRAPH大會上，來自華盛頓大學(University of Washington)的研究人員展示了他們的研究成果。他們使用了一種演算法，可以將一段音訊記錄插入同一個人不同場景下的獨立視訊中。

為了展示該項技術，該研究團隊製作了一段美國前總統巴拉克·奧巴馬（Barack Obama）談論恐怖主義等多個話題的場景，視訊中呈現的是奧巴馬先前從未發表過的言論，視訊逼真到毫無破綻。他們將奧巴馬的多個音訊片段生成真實的口型，然後經過細節處理，覆蓋到目標視訊中的奧巴馬面部。最後調整目標視訊的時間，使得奧巴馬的表情看起來更加自然，且與語言表達節奏相符。

前段時間一種叫做DeepFakes的人臉交換技術在網上引起了不小風波，該技術可以將影像或者視訊中的一張臉換成另一張臉，而且效果非常逼真。2017年12月，一個名為“DeepFakes”的使用者在Reddit上釋出了一個“假視訊”，他把《神奇女俠》主角蓋爾·加朵(Cal Gadot)的臉嫁接到一個成人電影女星的身上，看起來幾乎毫無破綻。這項看似非常卓越的技術卻讓研發者和參與者很為之懊惱，我們也不得不擔憂這種技術帶來的偽造問題。

打擊AI建立的視訊偽造

史丹佛大學（Stanford University）教授MichaelZollhöfer在新聞釋出會上說到：“隨著視訊編輯技術的不斷提高，我們必須更加嚴格的審視我們每天消費的視訊，特別是那些沒有現實依據的視訊。”

為此，研究團隊也正在訓練同樣的神經網路來識別視訊偽造。他們建議開發人員對通過AI或者其他方式編輯過的視訊進行水印新增，並明確指出場景中的哪些部分和元素被修改。

為了阻止不道德使用者，美國國防高階研究計劃局（DARPA）正在支援一個名為Media Forensics（媒體取證）的專案，該專案要求研究人員開發自動評估影像或視訊完整性的技術，作為媒體取證平臺的一部分。

Turek在接受《麻省理工技術評論》採訪時表示，目前為止，該專案已經能夠在GAN操縱過的視訊中找到線索，我們可以檢測到視訊是否被修改過。在一項報告中，研究人員發現了在Deepfakes情況下的人是很少眨眼睛的，就如同FAKEAPP一樣，AI始終是在靜止的圖片上訓練的。但這種說法在Deep Video Portraits上似乎沒有明顯的效果，Deep Video Portraits似乎完美地匹配了源人物和目標人物的切換。

Zollhöfer表示，將來，資料取證領域將被賦予更多的關注，即便人類的眼睛無法識別視訊的真偽，但技術也會帶來更好的識別方法。

來自 “ ITPUB部落格 ” ，連結：http://blog.itpub.net/31542119/viewspace-2213599/，如需轉載，請註明出處，否則將追究法律責任。

影片操縱中的新AI技術轉向
2018-09-05
AI
線上社交網路中的操縱武器
2022-03-04
建立和操縱表
2020-10-14
擁抱智慧，AI 視訊編碼技術的新探索
2021-11-23
AI
短視訊技術詳解：Android端的短視訊開發技術
2018-08-03
Android
面向視訊的全新AI架構 —— 阿里雲智慧視覺技術全解
2019-04-02
AI架構阿里視覺
AI攻擊技術和測試研究框架解鎖新視野~用技術對抗技術
2020-04-30
AI框架
技術轉向專案管理的心得筆記
2021-08-08
專案管理筆記
縱向控制的橫向滾動
2024-05-01
Java中的反射技術--小白新手向
2020-11-19
Java反射
AI晶片的新風向
2020-07-14
AI晶片
MYSQL中的DDL（用來操縱資料庫物件的語言）1
2018-09-17
MySql資料庫物件
excel文字橫向變縱向快捷鍵 excel文字方向改為縱向
2022-05-15
Excel
音視訊技術基礎
2018-09-29
防治肥胖，AI轉向
2021-05-11
AI
搜尋引擎如何操縱我們的思維
2018-05-29
搜狗AI走向產業改造：縱橫捭闔術與錄音筆的新聲態
2019-08-29
AI產業
技術胖TypeScript圖文視訊教程最汙的技術課
2018-09-24
TypeScript
連結串列，樹，順序表操縱
2020-12-23
騰訊雲CDB的AI技術實踐：CDBTune
2018-06-05
AI
技術實踐 | 場景導向的音視訊通話體驗優化原創
2022-06-28
優化
AI技術在基於風險測試模式轉型中的應用
2022-12-12
AI模式
承載AI技術創新，浪潮AI助力加速智慧新基建建設
2020-12-03
AI
JDBC:java提供的專門操縱資料庫的API
2021-01-01
JDBCJava資料庫API
NVIDIA RTX新技術成為直播行業的“風向標”
2019-10-17
行業
短視訊內容理解與生成技術在美團的創新實踐
2022-04-22
AI在視訊遊戲中的應用
2019-09-19
AI遊戲
Python爬蟲教程-28-Selenium 操縱 Chrome
2018-09-06
Python爬蟲Chrome
LiveVideoStackCon2021 北京站專訪：從上雲到創新，視訊雲的新技術、新場景
2021-11-02
IDE
左轉向善，右轉向惡，2020 年的九大 AI 風向標
2020-02-12
AI
音視訊技術：視訊質量評價方法簡介
2018-08-26
R資料分析：縱向分類結局的分析-馬爾可夫多型模型的理解與實操
2022-03-25
馬爾可夫多型模型
【免費報名】與阿里雲一同探索視訊雲的新技術與新場景
2021-10-27
阿里
再談訊息佇列技術-轉
2018-09-25
佇列
Android -- SeekBar（II）縱向seekBar
2020-12-05
Android
IPv4向IPv6轉換的幾種技術分析
2022-04-22
在PGConf.Asia-主論壇，縱覽騰訊雲PostgreSQL技術演進
2021-12-10
GCSQL
新基建技術新突破：騰訊釋出「雲深智藥」AI藥物研發平臺
2020-07-09
AI

視訊操縱中的新AI技術轉向

相關文章