「完結」16篇影像分類乾貨文章總結,從理論到實踐全流程大盤點

AIBigbull2050發表於2019-10-19
2019-10-11 12:38:37

專欄《影像分類》正式完結啦!我們從資料集展開講解,由最基本的多類別影像分類一步步深入到細粒度影像分類、多標籤影像分類,再到更加有難度的無監督影像分類,隨後我們又對影像分類中面臨的各種問題展開描述,較為全面的彙總了影像分類領域的相關內容。至此,我們再對整個影像分類專欄的內容進行一個大總結!

作者 | 郭冰洋 言有三

編輯 | 言有三

1 資料集和經典網路的交響曲

深度學習作為資料驅動的工具,需要大量優質的資料集才可以展開相應的工作。我們詳細總結了現階段影像分類各個領域的資料,並指出其適用的分類任務,為各位讀者展開相應的工作,提供了指南針。

同時,我們對經典的影像分類網路進行了總結,詳細介紹了影像分類發展史上的重大突破和典型的設計思想。

「完結」16篇影像分類乾貨文章總結,從理論到實踐全流程大盤點

「影像分類」分類專欄正式上線啦!初入CV、AI你需要一份指南針

「影像分類」從資料集和經典網路開始

2 多類別影像分類

多類別影像分類是影像分類最基本的一種,即對含有單一類別目標的影像進行分類。多類別影像分類現在已經融入至生活的方方面面,成功的應用至人臉識別等多個領域。

構建一個完整的影像分類任務,需要通過選擇開源框架、構建並讀取資料集、網路框架搭建、訓練並除錯引數、測試準確率五個步驟,本文以pytorch開源框架作為工具,白細胞作為資料集,完成了一個多類別影像分類任務。

「完結」16篇影像分類乾貨文章總結,從理論到實踐全流程大盤點

「影像分類」 基於Pytorch的多類別影像分類實戰

3 多標籤影像分類

現實生活中的圖片中往往包含多個類別的物體,相較於多類別影像分類,這也更加符合人的認知習慣。

多標籤影像分類可以告知我們影像中是否同時包含這些內容,這也能夠更好地解決實際生活中的問題。

在諸多解決方案中,通過標籤轉化的方式能夠快速的將多類別影像分類的思想遷移到多標籤影像分類中。在實戰部分,我們藉助這個思想,利用ResNet 50作為基礎框架,以pascal voc資料集實現了多標籤影像分類。

「完結」16篇影像分類乾貨文章總結,從理論到實踐全流程大盤點

「技術綜述」多標籤影像分類綜述

4 細粒度影像分類

細粒度影像分類是在區分出基本類別的基礎上,進行更精細的子類劃分,如區分鳥的種類、車的款式、狗的品種等,目前在工業界和實際生活中有著廣泛的業務需求和應用場景。

細粒度影像相較於粗粒度影像具有更加相似的外觀和特徵,加之採集中存在姿態、視角、光照、遮擋、背景干擾等影響,導致資料呈現類間差異性大、類內差異性小的現象,從而使分類更加具有難度。

實戰部分我們通過經典的雙線性網路結構,以CUB資料集完成了一個基本的細粒度分類任務。

「完結」16篇影像分類乾貨文章總結,從理論到實踐全流程大盤點

「影像分類」細粒度影像分類是什麼,有什麼方法,發展的怎麼樣

「影像分類」 基於Pytorch的細粒度影像分類實戰

5 無監督影像分類

現階段的影像分類任務在很大程度上是靠監督學習實現的,即每個樣本都有其對應的標籤,通過深度神經網路來不斷學習每個標籤所對應的特徵,並最終實現分類。這種情況下,資料集的容量、標籤的質量往往對模型的效能起到決定性的作用。

高質量資料集自然會帶來標註的困難,耗費大量的人力財力。在這種情況下,如何減少標籤資訊同時保證分類精度,也成了進一步的研究目標,這也是無監督影像分類的發展方向。

「完結」16篇影像分類乾貨文章總結,從理論到實踐全流程大盤點

「影像分類」簡述無監督影像分類發展現狀

6 類別不平衡

類別不平衡是指分類任務中不同類別的訓練樣本數目相差較大的情況,通常是由於樣本較難採集或樣本示例較少而引起的,經常出現在疾病類別診斷、欺詐型別判別等任務中。

本篇文章將對目前涉及到的相關解決方案進行彙總,共分為資料層面、演算法層面、資料和演算法混合層面三個方面,列舉具有代表性的方案闡述,以供讀者參考。

「完結」16篇影像分類乾貨文章總結,從理論到實踐全流程大盤點

「影像分類」 關於影像分類中類別不平衡那些事

7 標籤噪聲

在資料集製作過程中,由於主觀、客觀的原因,會導致標籤噪聲的出現,其存在會對最終的分類模型效能造成一定的影響。因此,在實際應用過程中,總是要對現有的資料集進行清洗,以避免標籤噪聲的干擾。

本文介紹了標籤噪聲的解決方式,並通過迭代訓練的方式進行實戰。目前還沒有一個完全高效妥善的方式可以解決這一問題,仍然處於一個研究發展的階段。

「完結」16篇影像分類乾貨文章總結,從理論到實踐全流程大盤點

「影像分類」 標籤噪聲對分類效能會有什麼樣的影響?

8 對抗攻擊

基於深度學習的影像分類網路,大多是在精心製作的資料集下進行訓練,並完成相應的部署,對於資料集之外的影像或稍加改造的影像,網路的識別能力往往會受到一定的影響。

在愈發重視安全資訊的今天,如何提升網路模型對噪聲、干擾等對抗樣本的魯棒性,是影像分類的進一步研究目標。

「完結」16篇影像分類乾貨文章總結,從理論到實踐全流程大盤點

「影像分類」 影像分類中的對抗攻擊是怎麼回事?

9 視覺化

覺得深度學習模型像個黑盒子?不能理解它的工作原理?那就視覺化做起來,在這裡我們給大家總結了影像分類模型視覺化的綜述和實戰案例。

「完結」16篇影像分類乾貨文章總結,從理論到實踐全流程大盤點

「影像分類」 實戰影像分類網路的視覺化

「技術綜述」“看透”神經網路

10 影像分類綜述

此外,我們還總結了影像分類的一個綜述,用於幫助大家理解不同層級的的影像分類的原理,這也是本專欄開設前的一篇總結文章。

「完結」16篇影像分類乾貨文章總結,從理論到實踐全流程大盤點

「技術綜述」你真的瞭解影像分類嗎?

11 影像分類模型架構

去年我們還總結了12期主流的深度學習模型架構的解讀,其中的大部分內容都是影像分類模型,供初學者方便進行系統性學習。如果想了解更多的千奇百怪的模型架構,可以申請加入有三AI知識星球,幾百期內容等你來讀。

「完結」16篇影像分類乾貨文章總結,從理論到實踐全流程大盤點

「完結」總結12大CNN主流模型架構設計思想

12 主流開源框架分類專案

為了讓大家更加容易上手,有三AI開源了12大深度學習開源框架的影像分類專案,從資料準備,模型定義,視覺化,訓練和測試,圖文教程和程式碼俱全,你還在等什麼呢?

「完結」16篇影像分類乾貨文章總結,從理論到實踐全流程大盤點

「完結」給新手的12大深度學習開源框架快速入門專案

總結

幾個月的時間來,在自己的努力和三哥的指導下,影像分類專欄終於完結了。希望各位能夠在專欄中有所收穫,得到一點提升。同時,非常感謝大家對我提出的意見和指導,這些都令我受益匪淺。

這段時間對於我自己來說是一個自我提升、不斷突破的階段。不僅鞏固了自己的基礎知識,也收穫了非常多的經歷。這些經歷讓我明白,踏踏實實做事,向著目標不斷努力,就一定會有收穫。

最後,還是送給大家專欄開始的那段話:

有志者,事竟成,百二秦關終屬楚。

苦心人,天不負,三千越甲可吞吳。



https://www.toutiao.com/i6746400270978122253/



來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/69946223/viewspace-2660599/,如需轉載,請註明出處,否則將追究法律責任。

相關文章