影像分類：來自13個Kaggle專案的經驗總結

THU数据派發表於2020-11-25

原文網址 : https://www.jiqizhixin.com/articles/2020-11-25-2

任何領域的成功都可以歸結為一套小規則和基本原則，當它們結合在一起時會產生偉大的結果。

機器學習和影像分類也不例外，工程師們可以透過參加像Kaggle這樣的競賽來展示最佳實踐。

在這篇文章中，我將給你很多資源來學習，聚焦於從13個Kaggle比賽中挑選出的最好的Kaggle kernel。這些比賽是:

Intel Image Classification：https://www.kaggle.com/puneet6060/intel-image-classification
Recursion Cellular Image Classification：https://www.kaggle.com/c/recursion-cellular-image-classification
SIIM-ISIC Melanoma Classification：https://www.kaggle.com/c/siim-isic-melanoma-classification
APTOS 2019 Blindness Detection：https://www.kaggle.com/c/aptos2019-blindness-detection/notebooks
Diabetic Retinopathy Detection：https://www.kaggle.com/c/diabetic-retinopathy-detection
ML Project — Image Classification：https://www.kaggle.com/c/image-classification-fashion-mnist/notebooks
Cdiscount’s Image Classification Challenge：https://www.kaggle.com/c/cdiscount-image-classification-challenge/notebooks
Plant seedlings classifications：https://www.kaggle.com/c/plant-seedlings-classification/notebooks
Aesthetic Visual Analysis：https://www.kaggle.com/c/aesthetic-visual-analysis/notebooks

我們會討論除錯深度學習解決方案的三個主要方面：

資料
模型
損失函式

還有很多例子專案(和參考資料)供你參考。

資料

影像預處理 + EDA

每一個機器學習/深度學習解決方案都從原始資料開始。在資料處理管道中有兩個基本步驟。

第一步是探索性資料分析 (EDA）。它幫助我們分析整個資料集並總結它的主要特徵，比如類分佈、大小分佈等等。通常使用視覺化方法來顯示這種分析的結果。

第二步是影像預處理，目的是對原始影像提高影像資料(也稱為影像特徵)的質量，透過抑制不必要的扭曲，縮放，增強重要的特徵，使資料更適合模型並提高效能。

你可以鑽研這些Kaggle筆記本，看看一些影像預處理技術：

Visualisation：https://www.kaggle.com/allunia/protein-atlas-exploration-and-baseline#Building-a-baseline-model-
Dealing with Class imbalance：https://www.kaggle.com/rohandeysarkar/ultimate-image-classification-guide-2020
Fill missing values (labels, features and, etc.)：https://www.kaggle.com/datafan07/analysis-of-melanoma-metadata-and-effnet-ensemble
Normalisation ：https://www.kaggle.com/vincee/intel-image-classification-cnn-keras
Pre-processing：https://www.kaggle.com/ratthachat/aptos-eye-preprocessing-in-diabetic-retinopathy#3.A-Important-Update-on-Color-Version-of-Cropping-&-Ben's-Preprocessing
資料增強

資料增強可以透過從現有的訓練樣本中生成更多的訓練資料來擴充套件我們的資料集。透過大量的隨機轉換生成新的樣本，這些轉換不僅可以生成可信的影像，而且還反映了真實的場景 —— 稍後將對此進行詳細介紹。

這種技術得到了廣泛的應用，不僅僅是在訓練模型的資料樣本太少的情況下。在這種情況下，模型開始記憶訓練集，但無法泛化(在從未見過的資料上表現很差)。

通常，當一個模型在訓練資料上表現很好，但在驗證資料上表現很差時，我們稱之為過擬合。為了解決這個問題，我們通常會嘗試獲取新資料，如果沒有可用的新資料，則可以使用資料增強。

注：一般的經驗法則是始終使用資料增強技術，因為它有助於使我們的模型見識更多的變化並更好地泛化。即使我們有一個很大的資料集，也要使用資料增強，但這是以較慢的訓練速度為代價的，因為增強是線上完成的(即在訓練期間)。

此外，對於每個任務或資料集，我們必須使用反映可能的現實場景的增強技術(例如，如果我們有一個貓/狗探測器，我們可以使用水平翻轉、剪裁、亮度和對比度，因為這些增強匹配不同的照片拍攝方式。

這裡是一些Kaggle比賽notebooks，你可以檢視流行的資料增強技術：

Horizontal Flip：https://www.kaggle.com/datafan07/analysis-of-melanoma-metadata-and-effnet-ensemble
Random Rotate and Random Dihedral：https://www.kaggle.com/iafoss/pretrained-resnet34-with-rgby-0-460-public-lb
Hue, Saturation, Contrast, Brightness, Crop：https://www.kaggle.com/cdeotte/triple-stratified-kfold-with-tfrecords
Colour jitter：https://www.kaggle.com/nroman/melanoma-pytorch-starter-efficientnet

模型

影像分類：來自13個Kaggle專案的經驗總結

開發一個基線

在這裡，我們使用一個非常簡單的架構建立一個基本的模型，沒有任何正則化或dropout層，看看我們是否能超過50%的準確率基線。儘管我們不可能總能達到這個目標，但如果我們在嘗試了多種合理的架構後不能超過基線，那麼輸入資料可能不包含模型進行預測所需的資訊。

用Jeremy Howard的名言：

“你應該能夠在15分鐘內使用50%或更少的資料集快速測試你是否正在朝著一個有希望的方向前進，如果沒有，你必須重新考慮一切。”

開發一個足夠大可以過擬合的模型

一旦我們的基線模型有足夠的能力超過基線分數，我們就可以增加基線模型的能力，直到它在資料集上過擬合為止，然後我們就開始應用正則化。我們可以透過以下方式增加模組容量：

新增更多層
使用更好的結構
更完善的訓練流程

結構

根據文獻，以下架構的改進提高了模型的容量，但幾乎沒有改變計算複雜度。

Residual Networks
Wide Residual Networks
Inception
EfficientNet
Swish activation
Residual Attention Network

大多數時候，模型容量和精度是正相關的 —— 隨著容量的增加，精度也會增加，反之亦然。

訓練過程

下面是一些你可以用來調整你的模型的訓練過程，透過例項專案來看看它們是如何工作的：

Mixed-Precision Training
Large Batch-Size Training
Cross-Validation Set
Weight Initialization
Self-Supervised Training (Knowledge Distillation)
Learning Rate Scheduler
Learning Rate Warmup
Early Stopping
Differential Learning Rates
Ensemble
Transfer Learning
Fine-Tuning

超引數除錯

與引數不同，hyperparameters是由你在配置模型時指定的(即學習率、epoch的數量、hidden units的數量、batch size大小等)。

你可以透過使用hyperparameter調優庫，比如Scikit learn Grid Search，Keras Tuner來自動化這個過程，而不是去手動配置。這些庫會在你指定的範圍內嘗試所有的hyperparameter組合，返回表現最好的模型。

需要調優的超引數越多，過程就越慢，因此最好選擇模型超引數的最小子集進行調優。

並不是所有的模型超引數都同樣重要。一些超引數會對機器學習演算法的行為產生巨大的影響，進而影響其效能。你應該小心地選擇那些對模型效能影響最大的引數，並對它們進行調優以獲得最佳效能。

正則化

這種方法迫使模型學習有意義和具有泛化能力的資料表示，透過對記憶/過擬合和欠擬合進行懲罰來實現，使模型對於它沒見過的資料更魯棒。

解決上述問題的一個簡單方法是獲得更多的訓練資料，因為一個模型訓練的資料越多，自然就會泛化得越好。

這裡有一些技巧你可以試著減輕過擬合和欠擬合，專案如下：

Adding Dropout：https://www.kaggle.com/allunia/protein-atlas-exploration-and-baseline
Adding or changing the position of Batch Norm：https://www.kaggle.com/allunia/protein-atlas-exploration-and-baseline
Data augmentation：https://www.kaggle.com/cdeotte/triple-stratified-kfold-with-tfrecords
Mixup：https://arxiv.org/abs/1710.09412
Weight regularization：https://www.kaggle.com/allunia/protein-atlas-exploration-and-baseline
Gradient clipping：https://www.kaggle.com/allunia/protein-atlas-exploration-and-baseline

損失函式

損失函式也被稱為成本函式或目標函式，用於查詢目標輸出的模型之間的差異，並幫助模型最小化它們之間的距離。

這裡是一些最流行的損失函式，與專案例項，你會發現一些技巧，以提高你的模型的能力：

Label smoothing
Focal loss
SparseMax loss and Weighted cross-entropy
BCE loss, BCE with logits loss and Categorical cross-entropy loss
Additive Angular Margin Loss for Deep Face Recognition
評估 + 錯誤分析

在這裡，我們做消融研究，並分析我們的實驗結果。我們確定了我們的模型的弱點和長處，並確定了未來需要改進的地方。在這個階段，你可以使用以下技術，並在連結的示例中檢視它們是如何實現的：

Tracking metrics and Confusion matrix：https://www.kaggle.com/vincee/intel-image-classification-cnn-keras
Grad CAM：https://arxiv.org/pdf/1610.02391v1.pdf
Test Time Augmentation (TTA)：https://www.kaggle.com/iafoss/pretrained-resnet34-with-rgby-0-460-public-lb

有許多實驗跟蹤和管理工具，採取最小設定為你自動儲存所有資料，這使消融研究更容易。

最後

有許多方法來調整你的模型，並且新的想法總是會出現。深度學習是一個快速發展的領域，沒有什麼靈丹妙藥。我們必須做很多實驗，足夠的試驗和錯誤會帶來突破。

Kaggle樹葉分類Leaves Classify總結
2021-07-29
日常專案經驗總結
2018-04-13
《軟體專案經驗總結》
2018-08-21
Swift 專案總結 02 常用分類方法
2018-06-02
Swift
工作專案經驗總結（1）-- 投影儀自動化測試 (Android)
2024-08-06
Android
Redis在專案中合理使用經驗總結
2019-04-25
Redis
一個專案經理的切身經驗總結：測試用例可以被替代嗎？
2019-12-06
React專案從Javascript到Typescript的遷移經驗總結
2019-05-06
ReactJavaScriptTypeScript
Kotlin專案中 GlideApp 構建失敗經驗總結
2018-10-18
KotlinIdeaAPP
Code Review 從失敗中總結出來的幾個經驗
2020-08-12
View
後端應用分層經驗總結
2023-01-30
後端
怎麼提高程式碼質量？-來自Google的研發經驗總結
2019-03-13
Go
2年經驗總結，告訴你如何做好專案管理
2022-11-29
專案管理
19 個來自 2019 React Conf 的總結
2019-11-12
React
Java集合類操作最佳化經驗總結
2021-09-09
Java
vue個人小專案總結
2018-06-22
Vue
基於影像視覺詞彙的文字分類方法(完整專案)
2018-03-05
視覺文字分類
工作經驗總結
2020-11-13
初中高階的 git 和 gerrit 技巧【大型專案實戰總結 && CR 經驗】
2019-01-28
Git
一個React專案總結（toB）
2019-11-13
React
電商網站專案總結：Vuex 帶來全新的程式設計體驗
2019-01-14
網站Vue程式設計
實驗室後臺管理專案總結
2018-08-27
【專案經驗】--環保專案
2018-06-03
jQuery 前後端分離專案總結
2019-03-03
jQuery後端
「影像分類」實戰影像分類網路的視覺化
2019-09-04
視覺化
java專案部署Linux伺服器幾種啟動方式總結經驗
2020-01-21
JavaLinux伺服器
我的刷題經驗總結
2021-10-27
【Vue專案總結】後臺管理專案總結
2019-06-18
Vue
做題經驗總結
2024-03-26
考試經驗總結
2024-10-23
BBS專案專案總結
2024-03-29
vue前端專案工作流（首個專案總結）
2018-12-04
Vue前端
十幾年來總結的最經典的專案，用來做python爬蟲實踐教學！
2018-11-11
Python爬蟲
《五行》從0到1設計遊戲——專案管理經驗總結
2021-05-10
遊戲專案管理
ArcGIS中的影像分類
2020-04-05
在我有限的軟體測試經歷裡，一段專職的自動化測試經驗總結
2022-05-10
JMeter測試WebSocket的經驗總結
2018-12-17
JMeterWeb
前端寫專案經驗
2018-09-11
前端

影像分類：來自13個Kaggle專案的經驗總結

相關文章