基於深度學習的安全帽檢測系統（網頁版+YOLOv8/v7/v6/v5程式碼+訓練資料集）

逗逗班学Python發表於2024-04-04

摘要：本文深入研究了基於YOLOv8/v7/v6/v5的安全帽檢測，核心採用YOLOv8並整合了YOLOv7、YOLOv6、YOLOv5演算法，進行效能指標對比。詳述了國內外研究現狀、資料集處理、演算法原理、模型構建與訓練程式碼，及基於Streamlit的互動式Web應用介面設計。在Web網頁中可以支援影像、影片和實時攝像頭進行安全帽檢測，可上傳不同訓練模型（YOLOv8/v7/v6/v5）進行推理預測，介面可方便修改。本文附帶了完整的網頁設計、深度學習模型程式碼和訓練資料集的下載連結。

1. 網頁功能與效果
2. 緒論
- 2.1 研究背景及意義
- 2.2 國內外研究現狀
- 2.3 要解決的問題及其方案
  - 2.3.1 要解決的問題
  - 2.3.2 解決方案
- 2.4 博文貢獻與組織結構
3. 資料集處理
4. 原理與程式碼介紹
- 4.1 YOLOv8演算法原理
- 4.2 模型構建
- 4.3 訓練程式碼
5. 實驗結果與分析
- 5.1 訓練曲線
- 5.2 PR曲線圖
- 5.3 YOLOv8/v7/v6/v5對比實驗
6. 系統設計與實現
- 6.1 系統架構概覽
- 6.2 系統流程
程式碼下載連結
7. 結論與未來工作

➷點選跳轉至文末所有涉及的完整程式碼檔案下載頁☇

完整資源中包含資料集及訓練程式碼，環境配置與介面中文字、圖片、logo等的修改方法請見影片，專案完整檔案下載請見演示與介紹影片的簡介處給出：➷➷➷
演示與介紹影片 ：https://www.bilibili.com/video/BV1bq421w7pu/
YOLOv8/v7/v6/v5專案合集下載：https://mbd.pub/o/bread/mbd-ZZ2Xm51q
YOLOv8和v5專案完整資源下載：https://mbd.pub/o/bread/mbd-ZZ2XmZtr
YOLOv7專案完整資源下載：https://mbd.pub/o/bread/mbd-ZZ2Xmpdu
YOLOv6專案完整資源下載：https://mbd.pub/o/bread/mbd-ZZ2Xm5dy

若您想獲得博文中涉及的實現完整全部資原始檔（包括測試圖片、影片，py, UI檔案，訓練資料集、訓練程式碼、介面程式碼等），這裡已打包上傳至博主的麵包多平臺，見可參考部落格與影片，已將所有涉及的檔案同時打包到裡面，點選即可執行，完整檔案截圖如下：

基於深度學習的安全帽檢測系統（網頁版+YOLOv8/v7/v6/v5程式碼+訓練資料集）

1. 網頁功能與效果

（1）開啟攝像頭實時檢測：本系統允許使用者透過網頁直接開啟攝像頭，實現對實時影片流中安全帽的檢測。系統將自動識別並分析畫面中的安全帽，並將檢測結果實時顯示在使用者介面上，為使用者提供即時的反饋。

（2）選擇圖片檢測：使用者可以上傳本地的圖片檔案到系統中進行安全帽檢測。系統會分析上傳的圖片，識別出圖片中的安全帽，並在介面上展示帶有安全帽標籤和置信度的檢測結果，讓使用者能夠清晰地瞭解到每個安全帽狀態。

（3）選擇影片檔案檢測：系統支援使用者上傳影片檔案進行安全帽檢測。上傳的影片將被系統逐幀分析，以識別和標記影片中每一幀的安全帽。使用者可以觀看帶有安全帽檢測標記的影片，瞭解影片中安全帽的變化。

（4）選擇不同訓練好的模型檔案：系統整合了多個版本的YOLO模型（如YOLOv8/v7/v6/v5），使用者可以根據自己的需求選擇不同的模型進行安全帽檢測。這一功能使得使用者能夠靈活地比較不同模型的表現，以選擇最適合當前任務的模型。

在“網頁功能與效果”章節中，我們詳細介紹了該安全帽檢測系統的Web介面功能及其對使用者如何進行安全帽識別和分析的支援。首先，我們概述了網頁介面的總體設計，強調了其使用者友好性和直觀性，使使用者能夠輕鬆地進行操作和管理。

實時攝像頭檢測功能允許使用者開啟攝像頭，實時捕捉影片流並在影片中標記出戴安全帽的人員，展示了演算法在實時環境下的應用效率和準確性。透過圖片和影片檔案檢測功能，使用者可以上傳圖片或影片檔案，系統將自動進行安全帽檢測，並顯示檢測結果，支援多種檔案格式和大小。

系統的核心之一是其模型選擇功能，使用者可以根據需要選擇不同的訓練模型（YOLOv8/v7/v6/v5）進行檢測，以獲得最佳的檢測效果。同時，顯示設定允許使用者根據需求選擇檢測畫面和原始畫面的顯示方式，並透過下拉框單獨標記和顯示特定目標的檢測結果。

在管理和最佳化檢測結果方面，我們提供了強大的工具。檢測結果管理功能使檢測結果以表格形式直觀展示，使用者可以動態調整檢測演算法的置信度閾值和IOU閾值，以最佳化檢測效果。為了方便後續分析和報告製作，結果匯出功能支援使用者將檢測結果和標記的影像或影片匯出為csv或avi格式檔案。

此外，我們還重點關注了使用者互動和體驗的最佳化，透過提供直觀的介面佈局、快速響應時間和易於導航的介面，確保了使用者可以高效地使用所有功能。透過一系列使用示例，我們展示瞭如何利用這些功能進行有效的安全帽檢測和分析，無論是在實時監控還是事後分析中，都能滿足使用者的需求。

2. 緒論

2.1 研究背景及意義

在當今社會，隨著工業化程序的加速，各類建設工地和工業區域的安全問題日益受到重視。安全帽作為最基本的個人防護裝備之一，其佩戴情況直接關係到工作人員的生命安全。因此，開發一個高效、準確的自動安全帽檢測系統顯得尤為重要。近年來，隨著計算機視覺和深度學習技術的快速發展，基於這些技術的安全帽檢測方法已成為研究的熱點。

在目標檢測技術領域，尤其是針對安全帽檢測的應用，最新的研究不斷推動著效能的邊界，引入更為高效和準確的演算法。深度學習的進步，特別是在卷積神經網路（CNN）和Transformer架構的基礎上，促成了多個創新演算法的誕生。這些演算法透過採用獨特的架構、訓練技巧和資料處理方法，顯著提升了目標檢測的效率和準確率。

對於安全帽檢測而言，準確快速地識別出未佩戴安全帽的工作人員，及時提醒和採取措施，對於防止事故的發生具有重要的實際意義。同時，這項技術的發展也促進了智慧監控系統在安全管理領域的應用，提高了安全管理的自動化和智慧化水平。

儘管已有眾多研究關注於利用深度學習技術進行安全帽檢測，但仍面臨一些挑戰，如檢測在複雜環境下的魯棒性、模型的實時效能最佳化以及對小目標檢測的準確性等。近期的研究工作不斷探索更為高效的網路結構，改進演算法，以及最佳化模型訓練方法，旨在提高檢測系統的效能。

2.2 國內外研究現狀

在過去幾年中，安全帽檢測領域經歷了顯著的技術進步，特別是深度學習演算法的應用極大地推動了這一研究領域的發展。儘管YOLO系列演算法因其出色的實時性和準確率在許多實時目標檢測任務中佔據主導地位，但研究者們也不斷探索和改進新演算法，以解決安全帽檢測中遇到的特定挑戰，如複雜背景的干擾、遮擋問題、以及對小目標的識別問題。

YOLOv8^[1]、YOLOv9透過進一步最佳化演算法結構和提高檢測速度與準確性，展現出在實時安全帽檢測中的巨大潛力。YOLOv8和YOLOv9透過採用更先進的特徵提取網路，改進了對小目標的檢測能力，這對於在複雜場景下識別安全帽尤為重要。

隨著研究的深入，資料集的質量和多樣性成為提高檢測效能的關鍵。早期研究多依賴於小規模或特定場景的資料集，限制了模型的泛化能力。近年來，大規模、多樣化的資料集的構建，如開放影像資料集（Open Images Dataset）和COCO資料集，為訓練更為強大和魯棒的模型提供了條件。這些資料集包含了豐富的場景和物件類別，有助於模型學習到更復雜的特徵，提高在實際應用中的效能。

與此同時，ViT和基於注意力機制的模型引入了Transformer^[2]架構，這在影像分類任務中已經顯示出優越的效能。這些模型透過自注意力機制捕獲全域性依賴關係，為目標檢測任務，特別是在處理高解析度影像時，提供了新的視角。儘管ViT在計算資源上的需求較大，但其在影像理解方面的強大能力，為開發更高效的安全帽檢測系統提供了可能。

RetinaNet和Faster R-CNN^[3]等演算法在處理目標檢測任務時表現出的平衡速度和準確性的特性，也為安全帽檢測提供了重要的技術支援。RetinaNet透過引入Focal Loss解決了類別不平衡問題，有效提高了小目標的檢測精度。Faster R-CNN作為一種經典的區域提議網路，透過區分前景與背景，進一步提高了檢測的準確性和效率。

DETR引入的端到端目標檢測正規化，透過直接利用Transformer解碼器輸出檢測結果，消除了傳統目標檢測流程中的一些複雜步驟，簡化了訓練過程，儘管訓練時間較長，但其在處理具有挑戰性的檢測任務中顯示出的潛力不容忽視。

Glod-YOLO作為一種新興的目標檢測模型，它透過改進YOLO的特徵提取和融合策略，進一步提升了對小目標的檢測效能，這對於在複雜環境中準確檢測安全帽至關重要。

2.3 要解決的問題及其方案

2.3.1 要解決的問題

在開發基於YOLOv8/v7/v6/v5的安全帽檢測系統過程中，我們面臨著一系列挑戰，這些挑戰不僅涉及技術層面，還包括使用者體驗和系統可持續發展等方面。以下是我們需要解決的主要問題：

安全帽檢測的準確性和速度
安全帽檢測的核心挑戰在於如何在複雜多變的工作環境中實現對人員是否佩戴安全帽的高準確度識別與實時處理。安全帽和人員可能因距離、光照、遮擋以及安全帽顏色和樣式的多樣性而影響檢測效果。因此，開發一個既能快速響應又能準確識別各種場景下安全帽的深度學習模型是本專案的首要任務。
環境適應性和模型泛化能力
工地等實際應用場景的複雜多變性對安全帽檢測提出了極大的挑戰。不同的光照條件、複雜的背景以及天氣變化等因素都可能影響識別的準確性。為了應對這些挑戰，我們的系統需要具備出色的環境適應性和模型泛化能力，以確保在各種環境條件下都能保持高識別準確率。
使用者互動介面的直觀性和功能性
對於安全帽檢測系統而言，使用者介面設計的直觀性和功能性對於確保使用者能夠有效利用系統至關重要。介面需要簡潔明瞭，減少使用者的學習曲線。同時，應合理佈局各項功能，如實時監控、歷史資料查詢、模型切換等，以提升使用者體驗。
資料處理能力和儲存效率
考慮到系統將處理大量的影像和影片資料，強大的資料處理能力和高效的儲存機制變得尤為重要。這不僅關係到識別的實時性，還涉及到長期資料的管理和查詢效率。此外，資料的安全性和隱私保護也是我們必須重視的問題。
系統的可擴充套件性和維護性
為了適應未來可能的需求變化，如支援更多種類的安全監測任務，或者整合新技術以提高識別效能，系統的設計應充分考慮到可擴充套件性。同時，易於維護的系統架構也是確保系統能夠持續穩定執行的關鍵。

為了克服這些挑戰，我們將採用最新的YOLO版本進行模型訓練和最佳化，利用PyTorch框架的靈活性和效率進行深度學習模型的開發，同時，透過Streamlit構建的Web應用將為使用者提供一個直觀、功能豐富的操作介面。我們的目標是開發一個既高效又易用的安全帽檢測系統，為提升工作場所的安全管理貢獻力量。

2.3.2 解決方案

針對安全帽檢測系統面臨的挑戰，我們設計了一套綜合解決方案，旨在透過最新的YOLO版本和先進的技術框架，實現一個既準確又快速、使用者友好且可擴充套件的系統。以下是我們的主要方法：

深度學習模型的選擇和最佳化

模型架構：我們選擇了YOLOv8、YOLOv7^[4]、YOLOv6^[5]、YOLOv5作為核心的深度學習模型。這些模型以其出色的速度和準確度平衡，在實時安全帽檢測任務中表現優異。特別是，YOLOv8作為系列中的最新版本，提供了改進的特徵提取和分類機制，進一步提高了檢測的準確性。
資料增強：為了增強模型的泛化能力，我們將採用多種資料增強技術，包括但不限於隨機裁剪、縮放、旋轉和色彩調整等，以適應不同的環境條件和安全帽樣式。
遷移學習：利用在大規模資料集上預訓練的模型作為起點，透過遷移學習技術，對特定的安全帽檢測任務進行微調，以加快訓練速度並提高模型的識別效能。

技術框架和開發工具

PyTorch框架：選擇PyTorch作為深度學習框架，憑藉其靈活的程式設計環境和強大的GPU加速能力，非常適合於快速開發和迭代深度學習模型。
Streamlit網頁設計：採用Streamlit構建互動式Web應用，因其將Python指令碼輕鬆轉換為美觀的Web應用的能力，大大簡化了Web介面的開發工作。
PyCharm IDE：使用PyCharm進行系統開發，該IDE支援Python語言並提供程式碼除錯、專案管理和版本控制等功能，極大提高了開發效率。

功能實現和系統設計

多輸入源支援：系統設計支援影像、影片和實時攝像頭捕獲等多種輸入源，以適應不同的使用場景，提高系統的適用性和靈活性。
模型切換功能：實現一個動態模型切換功能，讓使用者能根據實際需求選擇不同版本的預訓練YOLO模型，從而最佳化檢測效果和速度。
直觀美觀的使用者介面：利用Streamlit和CSS技術，設計一個既直觀又美觀的使用者互動介面，簡化操作流程，提升使用者體驗。

資料處理和儲存策略

高效資料處理：藉助PyTorch的高效資料載入和預處理機制，實現快速的資料處理流程，確保良好的實時效能。
智慧資料儲存：採用有效的資料儲存方案，對檢測結果進行組織和索引，便於長期資料的管理、查詢和分析。

透過實施上述方法，我們開發的安全帽檢測系統能夠在不同環境下準確、快速地進行安全帽的檢測與計數，同時提供友好的使用者體驗和強大的資料處理能力，滿足了科研和臨床應用。

2.4 博文貢獻與組織結構

本文系統地介紹了基於YOLOv8/v7/v6/v5的安全帽檢測系統的設計與實現，涵蓋了從任務定義、文獻綜述、資料集處理、演算法選擇與最佳化，到使用者介面設計、實驗結果分析及系統部署等多個方面。透過全面的研究與實踐，本文的主要貢獻可以概括為以下幾點：

詳盡的任務相關文獻綜述：本文提供了一篇全面的文獻綜述，深入分析了當前安全帽檢測領域的研究現狀，包括但不限於YOLO系列演算法的發展、其他目標檢測演算法的比較、以及安全帽檢測的應用場景等。這為理解和研究安全帽檢測提供了堅實的理論基礎。
資料集的處理：文章詳細介紹了安全帽檢測任務所使用的資料集處理方法，包括資料的收集、清洗、增強等步驟，以及如何有效地利用資料增強技術來提高模型的泛化能力。這些處理方法對於提升檢測模型的效能至關重要。
演算法選擇與效能對比：本文不僅介紹了採用的YOLOv8/v7/v6/v5等深度學習模型的原理和選擇理由，還詳細比較了這些演算法在安全帽檢測任務上的效能，包括檢測準確率、速度以及在不同場景下的表現。這為選擇合適的檢測模型提供了直接的指導。
美觀友好的網頁設計：文章展示瞭如何使用Streamlit框架設計和實現一個直觀、美觀、使用者友好的Web介面，使得使用者能夠輕鬆進行圖片、影片和實時攝像頭的安全帽檢測，以及動態切換不同的模型檔案，極大地提高了系統的可用性和互動性。
完整的資料集和程式碼資源：為了便於讀者理解和復現研究成果，本文提供了完整的資料集和程式碼資源的下載連結，包括資料預處理、模型訓練與預測的完整程式碼，以及基於Streamlit的Web應用設計程式碼。

後續章節的組織結構如下：緒論：介紹研究背景、目的和本文的主要貢獻；演算法原理：詳細介紹YOLOv8/v7/v6/v5等演算法的工作原理及其在安全帽檢測中的應用；資料集處理：討論使用的資料集及其預處理、增強方法。程式碼介紹：提供模型訓練和預測的詳細程式碼說明，包括環境搭建、引數配置和執行步驟。實驗結果與分析：展示不同模型在安全帽檢測任務上的實驗結果，並進行比較分析。系統設計與實現：介紹基於Streamlit的安全帽檢測系統的設計與實現細節。結論與未來工作：總結本文的研究成果，並討論未來的研究方向和潛在的改進空間。

3. 資料集處理

在本文的安全帽檢測專案中，我們精心構建和維護了一個詳盡的資料集，旨在訓練和評估基於YOLOv8/v7/v6/v5的深度學習模型。資料集的有效管理和分析是確保高質量檢測結果的關鍵。資料集共包含1518張影像，其中910張用於訓練，304張用於驗證，以及304張用於測試。這種劃分確保了模型在學習階段有足夠的資料去捕捉各種特徵，並在模型驗證和測試階段可以準確評估模型的效能和泛化能力。訓練集的規模使得模型能夠在足夠大的樣本空間內學習，而驗證集和測試集的相等分配則為效能評估提供了平衡的基礎。博主使用的類別如下：

Chinese_name = {'hat': "安全帽", 'person': "光腦袋" }

在資料預處理方面，我們採取了一系列的步驟來標準化輸入資料，以滿足模型訓練的要求。首先，所有影像都經過自動定向，確保影像的一致性，並且剝離了可能導致處理混淆的EXIF方向資訊。接著，每張影像都被調整到統一的解析度640x640畫素，採用拉伸方法來適應這一解析度。儘管這種方法可能會改變影像中物件的比例，但它簡化了模型架構，因為所有輸入影像的大小都是一致的，這對於運用卷積神經網路是十分必要的。

我們的資料集不僅在數量上滿足了深度學習的要求，而且在標註的精細度上也做得儘可能詳盡。如資料集分佈圖所示，我們的目標類別主要包括‘hat’和‘person’，其中‘person’類別的例項遠多於‘hat’，這反映了現場工人的數量及其安全帽佩戴狀況的實際分佈。此外，從標註框的分佈圖可以看出，大多數標註框集中在影像的中心區域，這表明工作人員通常位於影像的中心。而標註框的大小分佈則表明我們的資料集包含了從全身到僅頭部的各種尺度的目標，這有助於模型學習如何在不同大小的影像區域內識別目標。

從目標檢測資料集的資料集分佈圖中，我們可以進一步分析標註框的寬度和高度比例。這些分佈圖揭示了物件的一般形狀和尺寸比例，這是調整檢測演算法時重要的考慮因素。例如，較小的標註框可能表明遠距離的或部分遮擋的目標，而寬高比則反映了安全帽在視覺上的形狀特徵。

總的來說，本專案的資料集透過精心的設計和預處理，確保了深度學習模型能夠在各種條件下進行有效學習，並能在實際場景中準確地識別是否佩戴安全帽。這些資料不僅有助於訓練出高效能的模型，而且其豐富的標註還為深度學習的研究提供了寶貴的資源。

4. 原理與程式碼介紹

4.1 YOLOv8演算法原理

YOLOv8作為目標檢測領域的一項重要進展，其演算法原理體現了最新的技術革新和效能最佳化。這一模型不僅在傳統的YOLO架構上做出了改進，還引入了多項新技術以提高檢測的準確性和速度。

YOLOv8引入了一種新穎的損失函式，稱為'Distribution Focal Loss'，這對於處理不平衡的分類問題至關重要。在安全帽檢測任務中，某些細胞型別可能比其他型別更為罕見，傳統的損失函式可能會傾向於頻繁出現的類別，而忽略了較少見的型別。而'Distribution Focal Loss'透過調整對不同類別的關注度，確保模型能夠平衡地學習到各個類別，從而提升在所有類別上的整體效能。

YOLOv8採用了Task Aligned Assigner，這是一種智慧的任務對齊分配器。在安全帽檢測中，不同型別的細胞其大小和形狀有很大差異，傳統的目標分配策略可能不會給出最佳的學習效果。Task Aligned Assigner智慧地根據任務的特性來分配最合適的目標，最佳化了學習過程，提高了模型的魯棒性和檢測準確率。

此外，YOLOv8的設計還包括了深度學習中的多尺度特徵融合技術。這一技術允許模型利用多尺度的影像特徵進行更精細化的目標檢測。YOLOv8模型透過多層次的特徵融合，可以捕捉到從細微紋理到整體形狀等不同尺度的特徵，使得模型能夠在不同的檢測任務中都表現出色，無論是大型的細胞還是小型的微粒，都能被準確地檢測和分類。

最後，YOLOv8在速度和精度上取得了平衡。它透過高效的網路結構設計和最佳化的演算法實現，確保即使在處理複雜和大規模的資料集時，也能保持快速的檢測速度。YOLOv8的高效效能為實時應用提供了可能性，使得在臨床或研究環境中的快速安全帽檢測成為可能。

總的來說，YOLOv8將深度學習領域的最新進展融合在一起，形成了一個強大的安全帽檢測工具。透過這些創新技術的應用，我們的系統能夠準確地識別出各種安全帽，併為醫學研究和臨床診斷提供了強有力的技術支援。

4.2 模型構建

在我們的安全帽檢測專案中，程式碼的編寫旨在建立一個能夠快速準確檢測影像中是否存在未佩戴安全帽人員的系統。此部分程式碼介紹將側重於模型的構建和檢測過程，這是系統核心功能的直接體現。

首先，我們引入必要的Python庫和模組，這些庫提供了影像處理、深度學習模型載入和執行裝置選擇等功能。例如，cv2庫來自OpenCV，是處理影像和影片的強大工具；torch是PyTorch深度學習框架的核心庫，它提供了構建和執行深度學習模型所需的所有功能。

import cv2
import torch
from QtFusion.models import Detector
from datasets.label_name import Chinese_name
from ultralytics import YOLO
from ultralytics.utils.torch_utils import select_device

在程式碼中，我們設定了裝置型別，並初始化了模型和影像處理的一些基本引數。這些引數包括物體的置信度閾值、非極大值抑制（NMS）的IOU閾值以及類別過濾器。

device = "cuda:0" if torch.cuda.is_available() else "cpu"
ini_params = {
    'device': device,
    'conf': 0.25,
    'iou': 0.5,
    'classes': None,
    'verbose': False
}

為了數出每個類別的例項數量，我們定義了一個函式count_classes。它利用了一個字典來儲存每個類別的計數，並透過遍歷檢測資訊來更新這個計數。這為我們提供了一個清晰的檢視，瞭解哪些安全帽類別最常見，哪些比較罕見。

def count_classes(det_info, class_names):
    count_dict = {name: 0 for name in class_names}
    for info in det_info:
        class_name = info['class_name']
        if class_name in count_dict:
            count_dict[class_name] += 1
    count_list = [count_dict[name] for name in class_names]
    return count_list

程式碼中定義了一個YOLOv8v5Detector類，它是基於Detector類的子類，這表明我們的檢測器是在一個更一般的檢測器基礎上定製的。這樣做的好處是我們可以重用Detector類中的許多功能，並在此基礎上新增我們特定模型的細節。load_model方法是載入預訓練模型的核心。它首先使用select_device函式選擇合適的裝置，然後載入YOLO模型，並確保所有類名都轉換為中文，以方便後續的理解和顯示。這對於確保我們的系統在本地化環境中可用非常重要。preprocess方法在這裡沒有進行復雜的處理，僅儲存原始影像。這為未來可能的影像處理步驟預留了空間。predict方法是系統執行預測的地方，它呼叫YOLO模型的推理函式，並將處理後的影像傳遞給模型進行預測。

class YOLOv8v5Detector(Detector):
    def __init__(self, params=None):
        super().__init__(params)
        self.model = None
        self.img = None
        self.names = list(Chinese_name.values())
        self.params = params if params else ini_params
	def load_model(self, model_path):
	    self.device = select_device(self.params['device'])
	    self.model = YOLO(model_path)
	    names_dict = self.model.names
	    self.names = [Chinese_name[v] if v in Chinese_name else v for v in names_dict.values()]
	    self.model(torch.zeros(1, 3, *[self.imgsz] * 2).to(self.device).type_as(next(self.model.model.parameters())))
	def preprocess(self, img):
	    self.img = img
	    return img
	
	def predict(self, img):
	    results = self.model(img, **ini_params)
	    return results
	
	def postprocess(self, pred):
	    results = []
	    for res in pred[0].boxes:
	        for box in res:
	            class_id = int(box.cls.cpu())
	            bbox = box.xyxy.cpu().squeeze().tolist()
	            bbox = [int(coord) for coord in bbox]
	            result = {
	                "class_name": self.names[class_id],
	                "bbox": bbox,
	                "score": box.conf.cpu().squeeze().item(),
	                "class_id": class_id,
	            }
	            results.append(result)
	    return results
	    
    def set_param(self, params):
        self.params.update(params)

postprocess方法處理模型的輸出。對於每個預測結果，我們從輸出中提取類別、邊界框和置信度分數，並將它們格式化為更易於理解和處理的形式。我們也將類別ID轉換為對應的中文名稱，再次強調易於理解。最後，set_param方法允許動態更新引數，使我們的檢測器在執行時可以調整配置，以適應不同的檢測需求。

這部分程式碼是安全帽檢測系統中至關重要的組成部分，它不僅封裝了模型的載入、預測和結果處理，而且還提供了足夠的靈活性，使系統可以適應多種執行條件。透過這種設計，我們的系統能夠在保持高效能的同時，也能為使用者提供直觀和本地化的輸出結果。

4.3 訓練程式碼

在我們的安全帽檢測系統中，訓練一個高效、準確的模型是實現目標檢測的關鍵。我們使用的訓練指令碼是構建這一系統的核心，它涉及多個重要步驟，每個步驟都經過精心設計以確保最終模型的效能。以下是訓練模型的詳細程式碼介紹。以下表格詳細介紹了YOLOv8模型訓練中使用的一些重要超引數及其設定：

超引數	設定	說明
學習率（`lr0`）	0.01	決定了模型權重調整的步長大小，在訓練初期有助於快速收斂。
學習率衰減（`lrf`）	0.01	控制訓練過程中學習率的降低速度，有助於模型在訓練後期細緻調整。
動量（`momentum`）	0.937	加速模型在正確方向上的學習，並減少震盪，加快收斂速度。
權重衰減（`weight_decay`）	0.0005	防止過擬合，透過在損失函式中新增正則項減少模型複雜度。
熱身訓練週期（`warmup_epochs`）	3.0	初始幾個週期內以較低的學習率開始訓練，逐漸增加到預定學習率。
批次大小（`batch`）	16	每次迭代訓練中輸入模型的樣本數，影響GPU記憶體使用和模型效能。
輸入影像大小（`imgsz`）	640	模型接受的輸入影像的尺寸，影響模型的識別能力和計算負擔。

環境設定與模型載入：首先，我們匯入了os和torch庫以及yaml解析庫，它們是檔案操作和模型訓練不可或缺的工具。ultralytics庫提供了YOLO模型的介面，QtFusion.path則是用來處理檔案路徑。

import os
import torch
import yaml
from ultralytics import YOLO  # 用於載入YOLO模型
from QtFusion.path import abs_path  # 用於獲取檔案的絕對路徑

接下來，我們定義device變數來指定訓練時使用的裝置，如果檢測到可用的GPU，就使用第一塊GPU（"0"），否則使用CPU。

device = "0" if torch.cuda.is_available() else "cpu"

資料集準備：我們設定了資料載入所需的工作程序數量和批次大小，這兩個引數有助於加速資料的載入過程和提高批次處理的效率。workers引數定義了多少個子程序被用來載入資料，而batch則決定了每次輸入模型的資料量。我們還需要定義和讀取訓練資料集的配置檔案。這個檔案包含了訓練和驗證資料集的路徑，以及分類的名稱和類別。我們透過轉換路徑格式確保了它在不同作業系統間的相容性。

workers = 1  # 工作程序數
batch = 8  # 每批處理的影像數量
data_name = "Helmet"
data_path = abs_path(f'datasets/{data_name}/{data_name}.yaml', path_type='current')
unix_style_path = data_path.replace(os.sep, '/')

之後，我們透過讀取並可能修改YAML配置檔案來確保資料集的路徑是正確的。如果需要，我們會將路徑更新為正確的目錄路徑：

directory_path = os.path.dirname(unix_style_path)
with open(data_path, 'r') as file:
    data = yaml.load(file, Loader=yaml.FullLoader)

if 'path' in data:
    data['path'] = directory_path
    with open(data_path, 'w') as file:
        yaml.safe_dump(data, file, sort_keys=False)

訓練模型：最後，我們載入預訓練的YOLO模型，並開始訓練流程。模型訓練開始。我們指定了許多訓練引數，包括訓練資料的配置檔案路徑、選擇的裝置、工作程序數、輸入影像大小、訓練週期數和每批次的大小。這些引數被細心調整，以確保模型能夠充分學習資料集中的特徵，而不會發生過擬合。

model = YOLO(abs_path('./weights/yolov5nu.pt', path_type='current'), task='detect')  # 載入預訓練的YOLOv8模型
# model = YOLO('./weights/yolov5.yaml', task='detect').load('./weights/yolov5nu.pt')  # 載入預訓練的YOLOv8模型
# Training.
results = model.train(  # 開始訓練模型
    data=data_path,  # 指定訓練資料的配置檔案路徑
    device=device,  # 自動選擇進行訓練
    workers=workers,  # 指定使用2個工作程序載入資料
    imgsz=640,  # 指定輸入影像的大小為640x640
    epochs=120,  # 指定訓練100個epoch
    batch=batch,  # 指定每個批次的大小為8
    name='train_v5_' + data_name  # 指定訓練任務的名稱
)
model = YOLO(abs_path('./weights/yolov8n.pt'), task='detect')  # 載入預訓練的YOLOv8模型
results2 = model.train(  # 開始訓練模型
    data=data_path,  # 指定訓練資料的配置檔案路徑
    device=device,  # 自動選擇進行訓練
    workers=workers,  # 指定使用2個工作程序載入資料
    imgsz=640,  # 指定輸入影像的大小為640x640
    epochs=120,  # 指定訓練100個epoch
    batch=batch,  # 指定每個批次的大小為8
    name='train_v8_' + data_name  # 指定訓練任務的名稱
)

透過這個訓練過程，我們期望訓練出一個能夠準確識別安全帽的模型，不僅在我們的驗證集上表現良好，而且在實際的應用場景中也能保持高準確率。

5. 實驗結果與分析

5.1 訓練曲線

在分析我們的安全帽檢測模型—基於YOLOv8演算法的訓練損失函式影像時，我們可以獲得許多關於模型效能的重要資訊。透過這些圖表，我們能夠深入理解模型在訓練過程中的學習效率和效果，並對最終的檢測能力進行預測。

首先，損失函式的下降趨勢是模型學習過程中最直觀的指標。在train/box_loss、train/cls_loss和train/obj_loss圖中，我們可以看到隨著訓練次數的增加，損失值穩步下降，這表明模型在最佳化過程中逐漸提高了對安全帽的識別精度。特別是，在初始的訓練階段，損失值迅速下降，這通常意味著模型在學習關鍵特徵，並快速適應訓練資料。

對於驗證集的損失值，即val/box_loss、val/cls_loss和val/obj_loss，我們也觀察到了類似的下降趨勢，儘管波動性更強，這是正常現象。驗證集上的損失值波動較大可能是由於資料本身的多樣性和複雜性導致的，但總體趨勢仍然是下降的，這表明模型具有一定的泛化能力。

在效能評估指標方面，metrics/precision和metrics/recall圖表為我們提供了模型效能的另一視角。精確度較高且相對穩定，表明模型在檢測安全帽時具有較高的信心水平，誤報率較低。而召回率的迅速上升則表明模型能夠檢測到大部分正類樣本，這對於安全帽檢測任務而言是非常重要的，因為漏檢可能會導致安全風險。

另外，平均精度（mAP）是評估目標檢測模型中一個非常重要的指標。從metrics/mAP@0.5和metrics/mAP@0.5:0.95可以看出，模型的平均精度穩步提高，其中mAP@0.5的增長更加顯著。這意味著在IoU閾值為0.5時，模型能夠以高準確率識別安全帽。mAP@0.5:0.95作為一個更為嚴格的評估指標，其增長雖然緩慢，但也顯示出正向增長，這表明模型在不同IoU閾值下都有較好的效能。

總之，這些圖表共同反映了模型在安全帽檢測任務上的優良訓練過程和潛力。損失函式的穩定下降和效能指標的持續提升表明，我們的模型在識別各種環境中的安全帽方面具有強大的能力，並且經過充分訓練後，有望在實際應用中表現出色。

5.2 PR曲線圖

在分析我們安全帽檢測系統的效能時，Precision-Recall (PR) 曲線提供了一個關鍵的評估指標。該曲線透過展示在不同閾值下模型的精確度（precision）和召回率（recall）來評估模型的檢測效能。從PR曲線圖可見，我們的模型在安全帽檢測任務上取得了卓越的效能。

精確度是指模型正確識別為正樣本的比例，而召回率則是指模型正確識別的正樣本佔所有真實正樣本的比例。理想情況下，高精確度與高召回率是我們所追求的，但通常這兩者之間存在權衡。PR曲線越靠近右上角，意味著模型能夠同時保持高精確度和高召回率，這是檢測系統效能優異的表現。

從曲線來看，我們的模型在“hat”和“person”兩個類別上均達到了0.893的mean Average Precision（mAP）@0.5。這意味著在IOU（Intersection over Union）閾值為0.5時，模型具有接近90%的平均精確度。mAP是一種常用的目標檢測演算法效能衡量指標，這裡的@0.5表示在IOU為0.5時的mAP值。IOU是一個評估預測邊界框和真實邊界框之間重疊度的指標，0.5的IOU被廣泛認為是一個合理的判斷標準，用於確定預測框是否足夠接近真實框。

曲線顯示在召回率低時（即對應於較高的置信度閾值），精確度保持在較高水平，這表明當模型非常確信其檢測結果時，這些結果通常是準確的。然而，隨著召回率的提高，精確度略有下降，這是由於在較低置信度閾值時模型開始將更多的不確定或邊緣案例分類為正樣本。

在實際應用中，這種高精確度表明我們的系統可以減少誤報的數量，從而提高安全帽穿戴的合規性監控效率。同時，較高的召回率確保了系統不會錯過過多的未佩戴安全帽的情況，這對於防止安全事故至關重要。

YOLOv8模型在安全帽檢測任務上能夠實現高精確度和高召回率的平衡，證明了模型對於安全帽檢測的有效性。這樣的分析結果對於進一步最佳化模型引數、提高實際部署的效率和可靠性具有重要意義。透過不斷迭代和改進，我們的模型有望在未來實現更高的檢測效能。

5.3 YOLOv8/v7/v6/v5對比實驗

（1）實驗設計：
本實驗旨在評估和比較YOLOv5、YOLOv6、YOLOv7和YOLOv8幾種模型在安全帽目標檢測任務上的效能。為了實現這一目標，博主分別使用使用相同的資料集訓練和測試了這四個模型，從而可以進行直接的效能比較。該資料集包含安全帽的影像。本文將比較分析四種模型，旨在揭示每種模型的優缺點，探討它們在工業環境中實際應用的場景選擇。

模型	影像大小 (畫素)	mAPval 50-95	CPU ONNX 速度 (毫秒)	A100 TensorRT 速度 (毫秒)	引數數量 (百萬)	FLOPs (十億)
YOLOv5nu	640	34.3	73.6	1.06	2.6	7.7
YOLOv8n	640	37.3	80.4	0.99	3.2	8.7
YOLOv6N	640	37.5	-	-	4.7	11.4
YOLOv7-tiny	640	37.4	-	-	6.01	13.1

（2）度量指標：

F1-Score：F1-Score 作為衡量模型效能的重要指標，尤其在處理類別分佈不均的資料集時顯得尤為關鍵。它透過結合精確率與召回率，提供了一個單一的度量標準，能夠全面評價模型的效能。精確率衡量的是模型在所有被標記為正例中真正屬於正例的比例，而召回率則關注於模型能夠識別出的真正正例佔所有實際正例的比例。F1-Score透過兩者的調和平均，確保了只有當精確率和召回率同時高時，模型的效能評估才會高，從而確保了模型對於正例的預測既準確又完整。

mAP（Mean Average Precision）：在目標檢測任務中，Mean Average Precision（mAP）是評估模型效能的重要標準。它不僅反映了模型對單個類別的識別精度，而且還考慮了所有類別的平均表現，因此提供了一個全域性的效能度量。在計算mAP時，模型對於每個類別的預測被單獨考慮，然後計算每個類別的平均精度（AP），最後這些AP值的平均數形成了mAP。

名稱	YOLOv5nu	YOLOv6n	YOLOv7-tiny	YOLOv8n
mAP	0.889	0.879	0.879	0.893
F1-Score	0.86	0.85	0.87	0.86

（3）實驗結果分析：

在對YOLOv5nu、YOLOv6n、YOLOv7-tiny和YOLOv8n進行對比分析時，我們的目的是評估這些不同版本的YOLO模型在相同資料集上的效能。透過這一實驗，我們可以理解各模型在安全帽檢測任務上的優勢和不足，從而為實際應用中的模型選擇提供依據。

從實驗結果來看，YOLOv8n在mAP上以0.893的成績領先於其他模型，而在F1-Score上，YOLOv7-tiny和YOLOv8n並列最高，都達到了0.86。mAP的高分意味著YOLOv8n在檢測安全帽時能夠更為準確地定位和識別物件。而高F1-Score則顯示了YOLOv8n和YOLOv7-tiny在精確度和召回率之間達到了良好的平衡，這在實際應用中尤為重要，因為它關係到系統既不錯過未佩戴安全帽的情況，也不過多地誤報。

從模型結構和設計的角度分析，YOLOv8n的優勢可能來源於它在網路架構上的改進，例如使用了更先進的卷積層、注意力機制和更高效的特徵提取方式，這使得它在識別具有複雜背景和不同光照條件下的安全帽時表現更佳。YOLOv7-tiny雖然在模型容量上可能較小，但其最佳化的結構和引數設定也讓它在資源有限的環境中表現出色。

而YOLOv5nu和YOLOv6n雖然在mAP上略低，但仍然展現出了相當不錯的效能。它們在模型大小和推理速度上可能更具優勢，這對於需要在邊緣裝置上部署的應用場景是至關重要的。總之，這些YOLO模型各有千秋，而優秀的效能與其內在的網路結構、訓練細節和適應性調優密切相關。對於未來的工作，我們可以繼續探索模型的微調和結構最佳化，以便更好地適應特定的安全帽檢測任務，實現更為精確和高效的檢測效能。

6. 系統設計與實現

6.1 系統架構概覽

在開發基於YOLOv8/v7/v6/v5的安全帽檢測系統時，我們採用了一種模組化和高度可擴充套件的設計理念。本系統旨在實現對於穿戴和未穿戴安全帽個體的實時識別與分析，確保工作場所的安全合規性。以下是我們系統架構設計的核心組成部分：

模型初始化

在系統的核心，我們採用了YOLOv8/v5Detector類來處理模型的載入和預測功能。此類負責載入預訓練的安全帽檢測模型，並提供了一個預測介面，用於處理輸入影像並返回檢測結果。模型型別的選擇可以透過model_type屬性進行設定，支援多版本的YOLO模型。

介面設計

系統的使用者介面由Detection_UI類負責管理，該類封裝了使用者互動的各個方面，包括檔案上傳、攝像頭選擇、引數配置等功能。我們透過Streamlit庫建立了直觀的Web介面，使使用者能夠輕鬆地上傳圖片或影片檔案，或者直接從選定的攝像頭獲取實時影像進行檢測。

引數配置

在系統側邊欄中，使用者可以自由調整置信度閾值(conf_threshold)和IOU閾值(iou_threshold)，以最佳化檢測效果。這些引數直接影響模型判斷目標是否為安全帽的標準，確保了系統的靈活性和適用性。

檢測流程

系統的檢測流程主要透過process_camera_or_file方法實現，支援處理來自檔案和攝像頭的輸入。對於檔案輸入，系統支援圖片和影片兩種格式，使用者上傳檔案後，系統將呼叫YOLOv8/v5Detector進行目標檢測並顯示結果。對於攝像頭輸入，系統將捕獲實時影像幀進行連續檢測。

結果展示與日誌記錄

檢測完成後，系統透過LogTable類進行結果的日誌記錄，包括檢測的目標型別、位置、置信度等資訊。同時，檢測結果將在使用者介面中實時展示，包括繪製的邊界框和標籤。使用者還可以透過側邊欄的匯出結果功能，將檢測日誌匯出為CSV檔案，便於後續的分析和報告。

模型與資料的管理

系統設計了abs_path和save_uploaded_file等工具方法，用於處理模型檔案和使用者上傳檔案的儲存。這些方法確保了系統的資料管理既高效又安全。

6.2 系統流程

在基於YOLOv8/v7/v6/v5的安全帽檢測系統中，整個工作流程可以被概括為以下幾個關鍵步驟。以下內容將為您詳細介紹這一流程：

初始化系統與配置： 系統啟動時首先進行初始化操作，這包括模型的載入、引數設定以及初始化介面佈局等。在Detection_UI類的__init__方法中完成這一過程，這裡面涉及到載入模型權重、設定置信度閾值(conf_threshold)、IOU閾值(iou_threshold)以及初始化Streamlit頁面佈局等。
設定側邊欄配置： 使用者透過側邊欄進行模型型別、模型檔案、置信度閾值、IOU閾值以及攝像頭等選項的配置。這一步驟在setup_sidebar方法中實現，使用者的選擇將直接影響檢測的效果和精度。
處理輸入源選擇： 根據使用者在側邊欄中的選擇，決定是從攝像頭實時獲取影像、從上傳的圖片檔案中讀取影像還是從影片檔案中提取幀進行檢測。process_camera_or_file方法負責處理這一邏輯。
幀處理與模型預測： 對於每一個輸入的影像幀，系統首先對其進行預處理以適配模型的輸入要求，然後使用載入的YOLO模型進行預測，獲取檢測結果。這一過程由frame_process方法實現。
結果展示與日誌記錄： 檢測完成後，系統將檢測結果（如檢測到的物件、置信度等）以圖形和文字的形式展示給使用者。此外，系統還提供了結果日誌記錄功能，允許使用者將檢測結果儲存下來。這一功能主要透過logTable例項來完成，它在Detection_UI類中被初始化並在檢測流程中不斷更新。
使用者互動與反饋： 使用者可以透過介面上的按鈕和選擇框與系統進行互動，如更改配置、啟動和停止檢測等。系統根據使用者的操作實時更新檢測流程和展示結果。

透過以上步驟，基於YOLOv8/v7/v6/v5的安全帽檢測系統能夠實現對工作場景中人員安全帽佩戴情況的實時監控與分析，為保障工作人員的安全提供強有力的技術支援。

程式碼下載連結

如果您希望獲取部落格中提及的完整資源包，包含測試圖片、影片、Python檔案(*.py)、網頁配置檔案、訓練資料集、程式碼及介面設計等，可訪問博主在麵包多平臺的上傳內容。相關的部落格和影片資料提供了所有必要檔案的下載連結，以便一鍵執行。完整資源的預覽如下圖所示：

資源包中涵蓋了你需要的訓練測試資料集、訓練測試程式碼、UI介面程式碼等完整資源，完整專案檔案的下載連結可在下面的影片簡介中找到➷➷➷

演示與介紹影片 ：https://www.bilibili.com/video/BV1bq421w7pu/
YOLOv8/v7/v6/v5專案合集下載：https://mbd.pub/o/bread/mbd-ZZ2Xm51q
YOLOv8和v5專案完整資源下載：https://mbd.pub/o/bread/mbd-ZZ2XmZtr
YOLOv7專案完整資源下載：https://mbd.pub/o/bread/mbd-ZZ2Xmpdu
YOLOv6專案完整資源下載：https://mbd.pub/o/bread/mbd-ZZ2Xm5dy

完整安裝執行教程：

這個專案的執行需要用到Anaconda和Pycharm兩個軟體，下載到資原始碼後，您可以按照以下連結提供的詳細安裝教程操作即可執行成功，如仍有執行問題可私信博主解決：

Pycharm和Anaconda的安裝教程：https://deepcode.blog.csdn.net/article/details/136639378；

軟體安裝好後需要為本專案新建Python環境、安裝依賴庫，並在Pycharm中設定環境，這幾步採用下面的教程可選線上安裝（pip install直接線上下載包）或離線依賴包（博主提供的離線包直接裝）安裝兩種方式之一：

Python環境配置教程：https://deepcode.blog.csdn.net/article/details/136639396（2,3方法可選一種）；
離線依賴包的安裝指南：https://deepcode.blog.csdn.net/article/details/136650641（2,3方法可選一種）；

如使用離線包方式安裝，請下載離線依賴庫，下載地址：https://pan.baidu.com/s/1uHbU9YzSqN0YP_dTHBgpFw?pwd=mt8u （提取碼：mt8u）。

7. 結論與未來工作

本文透過深入研究並實踐了基於YOLOv8/v7/v6/v5的深度學習模型在安全帽檢測領域的應用，成功開發了一個結合了這些先進演算法的安全帽檢測系統。透過對多個版本的YOLO模型進行細緻的比較和最佳化，本研究不僅提升了安全帽檢測的準確率和實時性，還透過Streamlit建立了一個直觀、美觀且易於使用的Web應用，使使用者能夠輕鬆地進行安全帽檢測，從而在實際應用中發揮重要作用。

經過一系列實驗驗證，本文所提出的方法在安全帽檢測的準確性和處理速度上都達到了令人滿意的水平。同時，我們還提供了完整的資料集處理流程、模型訓練和預測的程式碼，以及基於Streamlit的系統設計和實現細節，為後續的研究者和開發者復現和參考提供了方便。儘管取得了一定的成果，但安全帽檢測作為一個複雜多變的任務，仍然面臨著許多挑戰和改進空間。在未來的工作中，我們計劃從以下幾個方向進行探索：

模型最佳化： 繼續探索更深層次的網路結構和最佳化策略，如神經網路架構搜尋（NAS）技術，以進一步提升模型的效能和效率。
多模態融合： 考慮結合語音、文字等其他模態資訊，採用多模態學習方法進行安全帽檢測，以更全面地理解人類的情感和意圖。
跨域適應性： 研究跨文化、跨年齡組的安全帽檢測，透過領域自適應技術提高模型在不同人群和環境中的泛化能力。
使用者互動體驗： 進一步最佳化系統的使用者介面和互動設計，使其更加人性化、智慧化，以滿足更廣泛使用者的需求。
實際應用擴充： 探索安全帽檢測在更多實際應用場景中的應用，如線上教育、遠端會議、智慧客服等，以發揮其最大的社會和經濟價值。

總之，安全帽檢測技術正處於快速發展之中，隨著技術的不斷進步和應用場景的不斷擴充，我們相信在不久的將來，基於深度學習的安全帽檢測將在人機互動、社會安全、醫療健康等領域發揮更加重要的作用。

Qiu, Shi, et al. "Automated detection of railway defective fasteners based on YOLOv8-FAM and synthetic data using style transfer." Automation in Construction 162 (2024): 105363. ↩︎
Bietti, Alberto, et al. "Birth of a transformer: A memory viewpoint." Advances in Neural Information Processing Systems 36 (2024). ↩︎
Qin, Han, et al. "An Improved Faster R-CNN Method for Landslide Detection in Remote Sensing Images." Journal of Geovisualization and Spatial Analysis 8.1 (2024): 2. ↩︎
Zhao, Dewei, et al. "A Small Object Detection Method for Drone-Captured Images Based on Improved YOLOv7." Remote Sensing 16.6 (2024): 1002. ↩︎
Yusof, Najiha‘Izzaty Mohd, et al. "Assessing the performance of YOLOv5, YOLOv6, and YOLOv7 in road defect detection and classification: a comparative study." Bulletin of Electrical Engineering and Informatics 13.1 (2024): 350-360. ↩︎