帶你讀論文:基於深度學習的影像分類中資料增強的有效性

格伯納發表於2018-05-24

摘要

帶你讀論文:基於深度學習的影像分類中資料增強的有效性

本文旨在研究資料擴充的有效性。它將通過使用傳統資料擴充技術(比如裁剪、旋轉)或者現代意義上講的GAN(CycleGAN)。

導言

帶你讀論文:基於深度學習的影像分類中資料增強的有效性

在這一部分,作者指出神經網路可以從資料中獲益。他還舉了一個例子,用來說明谷歌語料庫的釋出如何基於文字的模型受益。作者並以此提出了一個有趣的觀點,大量的非結構化資料出現的任務就是尋找一個模式。當然,我們可以採取另一種方法,就是我們對一組小的結構化資料進行資料擴充。最後,作者介紹了他們將要進行的實驗資料集。如MNIST、和小圖象網資料。

相關工作

帶你讀論文:基於深度學習的影像分類中資料增強的有效性

在這一節中,作者回顧了一些常用的防止過度擬合的方法。介紹了增加正則化項、退出、批量歸一化和遷移學習等方法。此外,作者給出了資料增強技術的簡單描述,如幾何或色彩增強。(主要是仿射變換)。以及如何訓練GAN的基本描述。

方法

帶你讀論文:基於深度學習的影像分類中資料增強的有效性

這是它非常有趣的地方,作者將採取兩種不同的方法。

a)在訓練分類器之前進行資料擴充(使用GAN或仿射變換)

b)在分類器網路中使用預先的神經網路來實時擴充資料。

帶你讀論文:基於深度學習的影像分類中資料增強的有效性

帶你讀論文:基於深度學習的影像分類中資料增強的有效性

作者將使用傳統的擴充技術或CycleGAN(樣式傳輸)來執行資料擴充。(見下文)

最後,對於增強網路的需求,他們建立了一個小型的5 CNN網路,n並使用各種損失函式來訓練網路。1,內容損失2,風格缺失3 ,無損失。

資料集與特徵

帶你讀論文:基於深度學習的影像分類中資料增強的有效性

作者對三個資料集進行了實驗研究。(其中兩個資料集來自小影像網路,第三個資料集來自MNIST資料集。)第一個資料集由狗/貓的影像組成,第二個資料集由狗/金魚的影像組成。

實驗

帶你讀論文:基於深度學習的影像分類中資料增強的有效性

本實驗使用了兩種網路,分別是分類網路(SmallNet)和增強網路(Augmentation Network)。這兩個網路的網路架構如下所示。

帶你讀論文:基於深度學習的影像分類中資料增強的有效性

增強網路是通過是在同一個類連線兩個影像(在它們的通道維度中)來建立額外的影像。(這是資料增強部分)。增強網路只在訓練期間使用,而不是在測試期間使用,整個過程如下所示。

帶你讀論文:基於深度學習的影像分類中資料增強的有效性

最後要考慮的是損失函式,在影像增強後,作者引入了三種損失函式。(實際上是兩個,因為最後的損失函式根本不是損失函式。)

帶你讀論文:基於深度學習的影像分類中資料增強的有效性

第一個損失是增強影像和目標影像之間的損失,其項D為增強影像和目標影像的長度。

帶你讀論文:基於深度學習的影像分類中資料增強的有效性

第二個損失是格拉姆矩陣在增強影像和目標影像之間的損失。如上所述,第三個損失函式是無損失函式的。

結果

帶你讀論文:基於深度學習的影像分類中資料增強的有效性

對於所有的資料集,他們執行不同型別的增強,並得到以下結果。

帶你讀論文:基於深度學習的影像分類中資料增強的有效性

我們可以假設在神經增強的情況下無損失函式,(控制方法是將相同的影像輸入到增強網路中。)可以得到從增強網路生成的一些影像。

帶你讀論文:基於深度學習的影像分類中資料增強的有效性

作者指出,增強網路似乎從兩幅影像中提取了一些關鍵特徵,同時優化了背景畫素。

帶你讀論文:基於深度學習的影像分類中資料增強的有效性

結論與發展潛力

作者指出,使用更復雜的網路進行分類和增強是值得的。並指出與傳統的影像增強方法相比,GAN或神經增強具有較好的增強效果,且耗時較短。

論文地址:https://drive.google.com/viewerng/viewer?url=https://arxiv.org/pdf/1712.04621.pdf

來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/31509949/viewspace-2155022/,如需轉載,請註明出處,否則將追究法律責任。

相關文章