該專案包含大量的改進方式,並能降低改進難度,改進點包含 Backbone、Neck、Head、注意力機制、IoU 損失函式、多種 NMS、Loss 損失函式、自注意力機制系列、資料增強部分、啟用函式等部分,更多內容可以關注 YOLOAir 專案的說明文件。專案同時附帶各種改進點原理及對應的程式碼改進方式教程,使用者可根據自身情況快速排列組合,在不同的資料集上實驗, 應用組合改進點寫論文!模組元件化:幫助使用者自定義快速組合 Backbone、Neck、Head,使得網路模型多樣化,使得改進檢測演算法、工程演算法部署落地更便捷,構建更強大的網路模型。支援YOLOv5、YOLOv7、YOLOX、YOLOR、YOLOv3、YOLOv4、Scaled_YOLOv4、Transformer等演算法網路模型進行改進。專案地址: https://github.com/iscyy/yoloair持續更新支援更多的 YOLO 系列演算法模型,作者對可以進行改進的部分進行了分類:- CNN 和 Transformer 混合:BoTNet、CoTNet、Acmix
- 自注意力機制 Transformer:Transformer、Swin
- neck 包含 FPN、PANet、BiFPN 等主流結構,同時可以新增和替換任何模組
- YOLOX 的解耦合檢測頭 Decoupled Head
- YOLOv7 檢測頭 IDetect Head、IAuxDetect Head 等
- SE、CBAM、CA、GAM、ECA 等多種主流注意力機制
- CIoU、DIoU、GIoU、EIoU、SIoU、alpha IOU 等損失函式
- NMS、Merge-NMS、DIoU-NMS、Soft-NMS、CIoU-NMS、DIoU-NMS、GIoU-NMS、EIoU-NMS、SIoU-NMS、Soft-SIoUNMS、Soft-CIoUNMS、Soft-DIoUNMS、Soft-EIoUNMS、Soft-GIoUNMS 等持續更新中
- Mosaic、Copy paste、Random affine(Rotation, Scale, Translation and Shear)、MixUp、Augment HSV(Hue, Saturation, Value,Random horizontal flip)
- ComputeLoss、ComputeNWDLoss、ComputeXLoss、ComputeLossAuxOTA(v7)、ComputeLossOTA(v7) 等
- 支援載入 YOLOv3、YOLOv4、YOLOv5、YOLOv7、YOLOR 等網路的官方預訓練權重進行遷移學習
- 支援 Anchor-base 檢測器和 Anchor-Free 檢測器
- Conv, GhostConv, Bottleneck, GhostBottleneck, SPP, SPPF, DWConv, MixConv2d, DWT, BottleneckCSP2SAM, VoVCSP 等
以上元件模組使用統一模型程式碼框架、統一任務形式、統一應用方式,模組元件化可以幫助使用者自定義快速組合 Backbone、Neck、Head,使得網路模型多樣化,助力科研改進檢測演算法,構建更強大的網路模型。包括基於 YOLOv5 的其他幾十種改進網路結構等演算法模型的 yaml 配置檔案彙總,使用 YOLOv5 網路作為示範,可以將這些模組無縫加入到 YOLOv7、YOLOX、YOLOR、YOLOv4、Scaled_YOLOv4、YOLOv3 等系列 YOLO 演算法模組。使用者可自行基於提供的網路模組,進行自定義改進網路。YOLOAir 演算法庫彙總了多種主流 YOLO 系列檢測模型,一套程式碼彙集多種模型結構:以上多種檢測演算法網路模型使用統一程式碼框架,整合在 YOLOAir 程式碼庫中,統一應用方式。便於科研者用於論文演算法模型改進,模型對比,實現網路組合多樣化,包含輕量化模型和精度更高的模型,根據場景合理選擇,在精度和速度者兩個方面取得平衡。同時該庫支援解耦不同的結構和模組元件,讓模組元件化,透過組合不同的模組元件,使用者可以根據不同資料集或不同業務場景自行定製化構建不同檢測模型。程式碼遵循 YOLOv5 設計原則,使用方式基本和 YOLOv5 框架對齊。在 Python>=3.7.0 的環境中克隆版本倉並安裝 requirements.txt,包括 PyTorch>=1.7。$ git clone https://github.com/iscyy/yoloair.git # 克隆
$ cd yoloair
$ pip install -r requirements.txt # 安裝
$ python train.py --data coco128.yaml --cfg configs/yolov5/yolov5s.yaml
detect.py 在各種資料來源上執行推理, 並將檢測結果儲存到 runs/detect 目錄。$ python detect.py --source img.jpg
如果使用不同的模型推理資料集,可以使用 wbf.py 透過加權框融合來整合結果。在 wbf.py 中設定 img 路徑和 txt 路徑。