視訊操縱中的新AI技術轉向
視訊操縱中的新AI技術為“talking head”這一表達賦予了新的含義。在今年的美國SIGGRAPH盛會上,一個國際研究小組展示了一項名為Deep Video Portraits(深度視訊肖像)的新專案,向我們展示了面部表情合成的最新進展。
Deep Video Portraits專案依靠一種被稱為生成式對抗網路(GAN)的AI技術,可以實現目標視訊在源視訊的基礎上重新動畫。與僅限於面部表情操作的方法相比,該專案將完整的3D頭部位置、頭部旋轉、面部表情以及眼部細節從源參與者轉移到目標參與者。顧名思義,GAN將兩個完全對立的神經網路互相對撞,創造出一個真實的“人的腦袋”。通過自由重組源和目標引數,研發人員能夠演示各種各樣的視訊重寫,而無需明確的模擬頭髮、身體和背景。
簡單的理解就是:一個神經網路生成內容,另一個神經網路對內容進行處理,然後兩者相互作用產生一個現實的結果。它可以複製靜態的背景,然後實現人物頭部動畫,並且經過測試,最終效果完全能夠矇蔽人眼。
研究人員表示,該項技術有很大的應用潛力,有很多的創造性應用。其中一個重要的應用就是影視行業的後期製作。一段視訊拍攝完之後都需要經過後期的剪輯,一般需要調整演員的頭部或者面部表情的定位以便更好的匹配場景的預期框架。因為視訊是動態的,幾秒鐘的面部微表情調整就要修改數百幀的畫面,即便是專業的後期工作者也需要很長的修改時間。Deep Video Portraits的演算法技術就完全可以簡化這一程式,通過它可以調整任一時間段的面目表情或者修改拍攝片段的構圖錯誤等問題。
巴斯大學(University of Bath)運動捕捉研究中心的Christian Richardt在一份新聞稿中說到:“Deep Video Portraits可以在毫不費力的情況下就能產生真實的視覺效果。通過該項技術,演員的頭部和他們的面部表情可以輕鬆被編輯,巧妙的改變整個場景框架,實現完美的故事情節。”
AI 技術並非“Deepfakes”!
Deep Video Portraits並不是第一個使用人工智慧操作視訊和音訊的專案。在去年的SIGGRAPH大會上,來自華盛頓大學(University of Washington)的研究人員展示了他們的研究成果。他們使用了一種演算法,可以將一段音訊記錄插入同一個人不同場景下的獨立視訊中。
為了展示該項技術,該研究團隊製作了一段美國前總統巴拉克·奧巴馬(Barack Obama)談論恐怖主義等多個話題的場景,視訊中呈現的是奧巴馬先前從未發表過的言論,視訊逼真到毫無破綻。他們將奧巴馬的多個音訊片段生成真實的口型,然後經過細節處理,覆蓋到目標視訊中的奧巴馬面部。最後調整目標視訊的時間,使得奧巴馬的表情看起來更加自然,且與語言表達節奏相符。
前段時間一種叫做DeepFakes的人臉交換技術在網上引起了不小風波,該技術可以將影像或者視訊中的一張臉換成另一張臉,而且效果非常逼真。2017年12月,一個名為“DeepFakes”的使用者在Reddit上釋出了一個“假視訊”,他把《神奇女俠》主角蓋爾·加朵(Cal Gadot)的臉嫁接到一個成人電影女星的身上,看起來幾乎毫無破綻。這項看似非常卓越的技術卻讓研發者和參與者很為之懊惱,我們也不得不擔憂這種技術帶來的偽造問題。
打擊AI建立的視訊偽造
史丹佛大學(Stanford University)教授MichaelZollhöfer在新聞釋出會上說到:“隨著視訊編輯技術的不斷提高,我們必須更加嚴格的審視我們每天消費的視訊,特別是那些沒有現實依據的視訊。”
為此,研究團隊也正在訓練同樣的神經網路來識別視訊偽造。他們建議開發人員對通過AI或者其他方式編輯過的視訊進行水印新增,並明確指出場景中的哪些部分和元素被修改。
為了阻止不道德使用者,美國國防高階研究計劃局(DARPA)正在支援一個名為Media Forensics(媒體取證)的專案,該專案要求研究人員開發自動評估影像或視訊完整性的技術,作為媒體取證平臺的一部分。
Turek在接受《麻省理工技術評論》採訪時表示,目前為止,該專案已經能夠在GAN操縱過的視訊中找到線索,我們可以檢測到視訊是否被修改過。在一項報告中,研究人員發現了在Deepfakes情況下的人是很少眨眼睛的,就如同FAKEAPP一樣,AI始終是在靜止的圖片上訓練的。但這種說法在Deep Video Portraits上似乎沒有明顯的效果,Deep Video Portraits似乎完美地匹配了源人物和目標人物的切換。
Zollhöfer表示,將來,資料取證領域將被賦予更多的關注,即便人類的眼睛無法識別視訊的真偽,但技術也會帶來更好的識別方法。
來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/31542119/viewspace-2213599/,如需轉載,請註明出處,否則將追究法律責任。
來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/29829936/viewspace-2215410/,如需轉載,請註明出處,否則將追究法律責任。
相關文章
- 影片操縱中的新AI技術轉向AI
- 分析:操縱的藝術
- JavaScript視窗功能指南之操縱視窗 (轉)JavaScript
- 線上社交網路中的操縱武器
- MediaPost:營銷人員轉向“Programmatic Direct”技術,視訊可視度增長
- 擁抱智慧,AI 視訊編碼技術的新探索AI
- (中級)縱向選單
- 短視訊技術詳解:Android端的短視訊開發技術Android
- AI攻擊技術和測試研究框架解鎖新視野~用技術對抗技術AI框架
- 面向視訊的全新AI架構 —— 阿里雲智慧視覺技術全解AI架構阿里視覺
- 視訊對講技術
- 物件導向技術概述 (轉)物件
- AI晶片的新風向AI晶片
- “視網膜”重灌來襲 AI技術為視訊業務場景賦能AI
- 縱向控制的橫向滾動
- Java中的反射技術--小白新手向Java反射
- AI在視訊遊戲中的應用AI遊戲
- AI 在愛奇藝視訊廣告中的探索AI
- 音視訊技術基礎
- 技術胖Vue視訊集合Vue
- JavaScript也能操縱cookie函式JavaScriptCookie函式
- 搜狗AI走向產業改造:縱橫捭闔術與錄音筆的新聲態AI產業
- MYSQL中的DDL(用來操縱資料庫物件的語言)1MySql資料庫物件
- 技術胖TypeScript圖文視訊教程 最汙的技術課TypeScript
- excel文字橫向變縱向快捷鍵 excel文字方向改為縱向Excel
- 短視訊內容理解與生成技術在美團的創新實踐
- 我發現我的資料被操縱了……
- 技術類視訊教程網站網站
- FMS 流媒體視訊技術
- 技術轉向專案管理的心得筆記專案管理筆記
- 我是如何從技術轉向產品的
- 用JDBC操縱BLOB和CLOB資料JDBC
- IT技術如何轉向銷售創業創業
- 承載AI技術創新,浪潮AI助力加速智慧新基建建設AI
- 技術實踐 | 場景導向的音視訊通話體驗優化 原創優化
- 引領潮流的新業務、新技術―軟交換(轉)
- 音視訊技術:視訊質量評價方法簡介
- AI技術在基於風險測試模式轉型中的應用AI模式