yolov5實戰之皮卡丘檢測

haoliuhust發表於2021-01-14

原文網址 : https://www.cnblogs.com/haoliuhust/p/14275240.html

前言

從接觸深度學習開始一直都做的是人臉識別，基本上也一直都在用mxnet. 記得之前在剛接觸的時候看到部落格中寫到，深度學習分三個層次，第一個層次是分類，第二個層次是檢測，第三個層次是分割。人臉識別算是分類問題，也就是一直在第一個層次···一直都想有機會了解下第二個層次，奈何精力有限，工作中也沒有實際的專案需要。最近正好有個不急的檢測專案，趁此機會入門檢測吧。工作中聽同事提到yolov5效果不錯，而且文件指導也比較豐富，因此選擇從此入手，順便也熟悉下pytorch。本文就以訓練一個簡單的皮卡丘檢測作為入門吧，也激發下對檢測的學習興趣，暫時不涉及網路，anchor等細節的理解，只以訓練完為目標。

環境準備

安裝torch這些就不說了，本次訓練基於yolov5官方專案：
https://github.com/ultralytics/yolov5
clone後，pip install -r requirements.txt安裝各項依賴
基本的目錄結構如下：
data: 訓練資料和資料配置檔案以及訓練配置
models: 模型配置檔案
utils: 資料讀取、nms等各種訓練測試中用到的指令碼
weight:
train.py: 訓練指令碼
test.py：測試指令碼
detect.py: 執行指令碼

資料集準備

https://github.com/ultralytics/yolov5/wiki/Train-Custom-Data
根據官方指導，按需要的格式準備資料集：

一個圖片檔案對應一個同名的.txt label檔案
label檔案中每一行表示一個目標，格式為：class x_center y_center box_width box_height, 其中數值都是歸一化的。類別從0開始
按類似目錄方式防止資料，yolov5通過將圖片路徑中最後一個images換成labels去尋找對應的標籤

coco/images/000000109622.jpg  # image
coco/labels/000000109622.txt  # label

本文中用的資料來源於目標檢測資料集（皮卡丘）中，但原文是mxnet用的rec格式，因此需要轉換成yolo格式。我已經轉好了：
連結: 百度網盤資料集提取碼: rek1
下載後解壓即可得到符合格式要求的資料。
資料示例：

訓練前的配置

修改或新建dataset.yaml

在data目錄下，我們可以看到一個coco.yaml，內容如下：

# COCO 2017 dataset http://cocodataset.org - first 128 training images
# Train command: python train.py --data coco128.yaml
# Default dataset location is next to /yolov5:
#   /parent_folder
#     /coco128
#     /yolov5


# download command/URL (optional)
# download: https://github.com/ultralytics/yolov5/releases/download/v1.0/coco128.zip

# train and val data as 1) directory: path/images/, 2) file: path/images.txt, or 3) list: [path1/images/, path2/images/]
train: ./data/coco128/images/train2017/  # 訓練集圖片路徑
val: ./data/coco128/images/train2017/  # 驗證集圖片路徑

# number of classes，類別數
nc: 80

# class names，類別名
names: ['person', 'bicycle', 'car', 'motorcycle', 'airplane', 'bus', 'train', 'truck', 'boat', 'traffic light',
        'fire hydrant', 'stop sign', 'parking meter', 'bench', 'bird', 'cat', 'dog', 'horse', 'sheep', 'cow',
        'elephant', 'bear', 'zebra', 'giraffe', 'backpack', 'umbrella', 'handbag', 'tie', 'suitcase', 'frisbee',
        'skis', 'snowboard', 'sports ball', 'kite', 'baseball bat', 'baseball glove', 'skateboard', 'surfboard',
        'tennis racket', 'bottle', 'wine glass', 'cup', 'fork', 'knife', 'spoon', 'bowl', 'banana', 'apple',
        'sandwich', 'orange', 'broccoli', 'carrot', 'hot dog', 'pizza', 'donut', 'cake', 'chair', 'couch',
        'potted plant', 'bed', 'dining table', 'toilet', 'tv', 'laptop', 'mouse', 'remote', 'keyboard', 'cell phone',
        'microwave', 'oven', 'toaster', 'sink', 'refrigerator', 'book', 'clock', 'vase', 'scissors', 'teddy bear',
        'hair drier', 'toothbrush']

仿照這個格式，建立皮卡丘資料集的配置檔案：

# COCO 2017 dataset http://cocodataset.org - first 128 training images
# Train command: python train.py --data coco128.yaml
# Default dataset location is next to /yolov5:
#   /parent_folder
#     /coco128
#     /yolov5


# download command/URL (optional)
# download: https://github.com/ultralytics/yolov5/releases/download/v1.0/coco128.zip

# train and val data as 1) directory: path/images/, 2) file: path/images.txt, or 3) list: [path1/images/, path2/images/]
train: ./data/pikachu/images/train/  # 128 images
val: ./data/pikachu/images/val/  # 128 images

# number of classes
nc: 1

# class names
names: ['pikachu']

訓練引數配置

訓練引數配置在data/hyp.finetune.yaml和hyp.scratch.yaml中，前者是finetune用的，後者是從頭訓練的。這次我們直接用hyp.finetune.yaml，先不做修改。

模型配置

模型配置在models/yolov5s.yaml中。目前也不做修改。

開始訓練

訓練使用train.py指令碼，主要引數有：

--weights 預訓練權重，“”表示從頭訓  
--cfg 模型配置檔案路徑  
--data 資料配置檔案路徑  
--hyp 訓練引數配置檔案路徑  
--epochs 訓練的epoch數 
--batch-size 
--img-size 網路的輸入大小  
--noautoanchor 是否自動計算anchor  
--device 裝置號  
--workers dataloader執行緒數

還有很多其他引數，不過暫時用不上就先不管了,執行以下命令可開始訓練，指令碼會自動去下載yolov5s的預訓練權重進行訓練。

python train.py --weights yolov5.pt --data data/pikachu.yaml --hyp data/hyp.finetune.yaml --epochs 40 --img-size 320 --device 0 --batch-size 512

視覺化

yolov5裡面有兩種視覺化方式，一種是tensorboard, 一種是wandb。
其中wandb有兩種使用方式，一種是到https://wandb.ai/home註冊一個賬號，線上使用。註冊後新建專案,名字叫yolov5，然後本地安裝配置wandb, 按提示輸入必要的資訊（API Key):

pip install wandb  
wandb login

那麼訓練時就可以在自己的專案中看到如下畫面，還是挺不錯的，功能挺豐富：

不過這個網站挺卡的，好在wandb也有本地使用方式。

安裝docker後
wandb local

參考：https://docs.wandb.ai/self-hosted/local
然後就可以本地訪問了。

測試

有兩個指令碼和測試有關，test.py是用來跑測試集測效能的，detect.py是用來測試資料夾或攝像頭的。

python detect.py --source data/images --weights yolov5s.pt --conf-thres 0.25

在run/detect下即可找到影像畫有目標框的影像（也可以在執行detect.py的時候指定--view-img選項，即可顯示影像）：

結語

至此就訓練出了一個簡單的檢測模型呢，雖然很簡單，不過基本流程通了。在走通流程後就要繼續瞭解實現的細節，如何調參等等了。可以從瞭解網路結構開始，可參考 [https://zhuanlan.zhihu.com/p/343195876](https://zhuanlan.zhihu.com/p/343195876

注：如果資料集連結過期了，關注老司機的視覺屋，回覆pikachu即可獲取連結

yolov5實戰之二維碼檢測
2021-10-02
YOLO
YOLOv5模型訓練及檢測
2022-02-14
YOLO模型
Yolov5——訓練目標檢測模型
2023-03-17
YOLO模型
目標檢測---教你利用yolov5訓練自己的目標檢測模型
2022-06-14
YOLO模型
物體檢測實戰：使用 OpenCV 進行 YOLO 物件檢測
2022-01-10
OpenCVYOLO物件
位元組碼引用檢測原理與實戰
2021-12-07
人臉識別檢測專案實戰
2023-01-03
TF專案實戰（基於SSD目標檢測）——人臉檢測1
2019-07-20
個推異常值檢測和實戰應用
2021-01-28
.Net微服務實戰之可觀測性
2021-09-29
微服務
目標檢測之SSD
2018-12-18
目標檢測之RetinaNet
2018-12-19
NaN
微信域名檢測線上批次檢測如何實現？——利用域名檢測api介面實現批次檢測工具教程
2020-04-22
API
TorchVision Faster R-CNN 微調，實戰 Kaggle 小麥檢測
2021-03-04
ASTCNN
基於YOLOv5的目標檢測系統詳解（附MATLAB GUI版程式碼）
2023-05-04
YOLOMatlabGUI
計算機視覺3-> yolov5目標檢測1 |從入門到出土
2022-01-20
計算機視覺YOLO
“伏魔”賞金｜ WebShell檢測之「模擬汙點引擎」首次公測，邀你來戰！
2022-01-15
Webshell
遊戲測試 Perfdog 實戰之減少 CPU 消耗
2020-04-01
遊戲
Playwright自動化測試工具之元素定位實戰
2021-03-30
目標檢測之YOLO系列
2018-12-18
YOLO
LabVIEW+OpenVINO在CPU上部署新冠肺炎檢測模型實戰
2022-11-24
View模型
攻防演練｜實戰加分，安芯網盾可實時檢測冰蠍4.0
2022-07-26
實用測試技能分享：APP壓力穩定性測試之Monkey入門實戰
2019-01-23
APP
人眼疲勞檢測之opencv人眼檢測xml說明
2020-04-05
OpenCVXML
yolov5 自建資料集訓練測試
2020-11-06
YOLO
安裝YOLOv5模型環境並測試
2020-11-21
YOLO模型
介面測試之DDT，純程式碼實戰，學起來
2020-12-09
機器學習專案實戰----信用卡欺詐檢測(二)
2019-07-19
機器學習
機器學習專案實戰----信用卡欺詐檢測(一)
2019-07-18
機器學習
深度學習之瑕疵缺陷檢測
2019-06-20
深度學習
深度學習之目標檢測
2019-02-20
深度學習
CV總結之邊緣檢測
2024-11-30
opencv學習之邊緣檢測
2022-05-15
OpenCV
C++ yolov5 jetson NX盒子部署安全帽檢測 TensorRT, 支援INT8/FP16
2023-03-06
C++YOLO
【SpringBoot實戰】檢視技術-Thymeleaf
2022-04-23
Spring Boot
機器學習案例實戰之信用卡欺詐檢測【人工智慧工程師--AI轉型必修課】
2020-04-04
機器學習人工智慧工程師AI
開源APM效能檢測系統技術選型與架構實戰
2018-09-28
架構
介面自動化測試實戰之智慧場景如何攻破
2022-11-24