一週AI最火論文 | 100%揭穿偽造人臉影像,道高一丈反Deep Fake新方法

菜鳥要飛訂閱號發表於2022-12-05

一週AI最火論文 | 100%揭穿偽造人臉影像,道高一丈反Deep Fake新方法

大資料文摘專欄作品

作者:Christopher Dossman

編譯:Joey、Luna、雲舟


嗚啦啦啦啦啦啦啦大家好,本週的AI Scholar Weekly欄目又和大家見面啦!

AI ScholarWeekly是AI領域的學術專欄,致力於為你帶來最新潮、最全面、最深度的AI學術概覽,一網打盡每週AI學術的前沿資訊。

每週更新,做AI科研,每週從這一篇開始就夠啦


本週關鍵詞:文字理解、Python、姿勢估計


本週最佳學術研究


通用文字理解模型的軟體工具包


本文介紹了jiant,這是一個NLP領域的新開源包,它使研究人員可以使用最新的自然語言處理模型對各種自然語言理解任務進行快速實驗,並同時支援探測、轉移學習和多工訓練的實驗。該工具包目前仍處於持續開發階段。

這個工具基於PyTorch,並使用了AllenNLP和HuggingFace PyTorch轉換器包中的許多元件。Jiant目前實現了超過50項自然語言理解任務,包括所有GLUE和SuperGLUE基準測試任務。

作為由配置驅動的框架,jiant使得研究者可以透過簡單地編寫配置檔案來執行各種各樣的實驗。如果需要新增新功能,也可以輕鬆地編輯或擴充套件程式碼。

這一框架的程式碼是開源的,開發團隊也正在邀請更多人加入開發、公開問題或向本專案提交Pull Request

GitHub:
原文:


Python中的機器學習:資料科學,機器學習和人工智慧的主要發展和技術趨勢


Python因易於學習而廣為人知,並且仍然是資料科學、機器學習和科學計算中使用最廣泛的語言。KDnuggets最近的一項涉及1,800多名參與者的調查表明,2019年這一領域最廣泛使用的語言仍然是Python。

一週AI最火論文 | 100%揭穿偽造人臉影像,道高一丈反Deep Fake新方法

這篇研究論文旨在向讀者介紹當前在使用Python進行機器學習研究中最流行的主題和趨勢。研究人員進行了一項調查,深入瞭解了Python在機器學習領域的應用,並總結了一些重大挑戰、分類法和方法。在本文中,他們努力在學術研究和行業主題之間找尋平衡,並同時重點介紹了最相關的工具和軟體庫。

作為一種易於學習和使用的語言,Python已經發展成為在許多研究和應用領域中流行的語言。隨著CPU和GPU計算的發展以及Python使用者社群的不斷增長,該語言有望在未來許多年內繼續成為科學計算機的主流語言。

對於本領域的研究人員來說,該調查涵蓋了廣泛使用的框架和概念,它們被收集在一起並進行了整體比較,目的是為讀者提供最準確的資訊並推動Python機器學習領域的發展。

原文:


使用多工深度學習的2D / 3D姿勢估計和動作識別


在本文中,研究人員提出了一個多工框架,使用單眼彩色影像估計2D或3D人體姿勢,並從影片序列中對人類動作進行分類。

之所以如此,是因為人體姿勢估計和動作識別都強烈依賴於人體的表示和分析。但是,僅當涉及到最新技術時,才能分別處理這兩個問題。

這項研究現在表明,可以使用一種方法有效地解決這兩個問題,並且這一演算法在以每秒100幀以上的速度執行時,仍然可以在每個任務上達到最新或相當的結果。

所提出的3D姿勢方法提供了對具有低解析度特徵圖的高精度估計,並且透過預測每個人體關節的專門深度圖,從而不需要價格昂貴的體積熱圖。

在四個資料集(MPII,Human3.6M,Penn Action和NTU RGB + D)上的運算結果表明該方法在目標任務上表現良好。該方法可以使用混合的2D和3D資料進行訓練,這得益於精確的室內3D資料,以及使用手動註釋的2D“野外”影像,這證明了3D姿勢估計的顯著改進。而且,該方法還可以同時以無縫方式用單幀和影片剪輯進行訓練。

Demo影片:
程式碼:
原文:


一個新型檢測偽造人臉圖片的方法


這些年,由於機器學習和深度學習發展迅猛,假冒數字內容也相應激增。虛假數字內容引起了人們越來越多的關注,並且讓大家對影像內容的不信任感日益蔓延。這種需求,導致大家迫切地需要一種自動化的檢測偽造影像的技術。

為了區分出哪些是AI生成的假人臉影像,一群德國研究人員最近推出了一種新方法,並且成功地檢測出了虛假人臉圖片。具體來說,他們提出了一種基於經典頻域分析和簡單分類的機器學習新方法。

這個方法對特定影像有100%的檢測準確度,主要適用範圍是GANs兩個資料集中高解析度和中等解析度的假人臉圖片。與需要提供大量標記資料的現有技術水平相比,這個新的技術能在使用很少的帶註釋的訓練樣本的情況下,達到非常準確的結果,並且全程完全無監督。

如果能拿到高解析度的影像,並且不少於20個帶註釋的樣本對這個模型進行訓練,這個方法可實現100%的完美檢測率。研究人員還將此模型運用於主流的其他假圖片集,其準確度也能達到91%。

程式碼:
原文:

把服裝轉移到3D人體模型身上


將服裝自動轉移到3D人體模型這個技術,對於人類照片真實感的渲染、綜合性資料學習、虛擬試穿、藝術和設計的資料生成非常有用。儘管該領域目前受到的關注不算多,但是仍然有研究人員在努力改進現有的方法。

一週AI最火論文 | 100%揭穿偽造人臉影像,道高一丈反Deep Fake新方法


在這篇論文裡,研究人員提出了一種簡單而有效的方法,這個方法可以自動將服裝影像的正反面紋理實時轉換成到3D服裝。他們使用的主要方法是,在學習影像到服裝的UV貼圖的對映時僅僅使用輪廓資訊,而無需使用服裝的紋理資訊。

研究人員首先介紹了他們使用的引數化3D服裝模型,以及如何用這些模型來規範自動網格到影像輪廓擬合過程。由於擬合的過程昂貴且容易出錯,因此他們用了有效的神經對映(Pix2Surf),來將影像紋理實時傳輸到網格上。

他們提出的新模型,Pix2Surf,有著明顯優於2D TPS翹曲等經典方法的效能。因此,這項工作可以說,在將衣服紋理自動轉移到3D服裝的研究領域裡邁出了巨大的一步。它為未來更強大的應用的誕生(例如虛擬試戴)開啟了大門,並允許生成學習時所需的具有各種紋理的3D人體模型。

這項技術對於人類的真實感渲染、綜合性資料學習、虛擬試穿、藝術和設計的資料生成非常有用。

原文:

其他爆款論文


深度學習在自然語言處理方面的進展:

簡介:本研究對受益於深度學習的NLP的不同方面和應用進行了分類和處理。它涵蓋了NLP的核心任務和應用程式,並描述了深度學習方法和模型如何推動這些領域的發展。

非Markov任務的互動式機器人培訓:

簡介:在論文中,研究員提出了一種貝葉斯互動式機器人訓練框架,該框架允許機器人從老師提供的演示中學習,並讓老師對機器人的任務執行情況進行評估。受不確定性抽樣的啟發,他們還提出了一種新的主動學習方法來識別那些可接受性低的任務。論文證明了,與僅從演示中學習的方法相比,在新框架內進行的主動學習,可以在更大程度上確定教師的預期任務說明。

一個用於自動要素工程和選擇的Python庫:

簡介:它提供了一個多步驟的特徵工程和選擇過程:先生成大量的非線性特徵,然後從中選擇一小組健壯的有意義的特徵。這麼做能在提高線性模型的預測精度上,保留其可解釋性。

資料集


用於機器人的大型RGB-D資料集,這個資料集可以用於識別老年人的日常活動:

AI大事件


最熱門開發人員職位:
https://www.zdnet.com/article/developer-jobs-these-are-the-coders-who-are-most-in-demand/

電腦科學家防駭客共享金鑰的新武器:

資料和人工智慧將為沙烏地阿拉伯經濟帶來超過100億美元的價值: 

Google DeepMind在COVID-19冠狀病毒研究上的貢獻:

來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/31557372/viewspace-2679788/,如需轉載,請註明出處,否則將追究法律責任。

相關文章