Datawhale AI 夏令營第五期 CV方向 02進階

程序员shaun發表於2024-08-29

原文網址 : https://www.cnblogs.com/zynevergiveup12/p/18387605

上次的baseline方案，訓練的模型，獲得分數並不高，DataWhale提供了兩個上分的思路

增加訓練資料集

切換不同模型預訓練權重

增加訓練集的大小通常可以提高模型的泛化能力，因為更多的資料可以幫助模型學習到更多的特徵和模式。但是，越大的資料集，就意味著需要更多的計算資源和時間來訓練模型，以及可能出現的過擬合問題。

增加訓練資料集

增大資料集的一些方法：

資料增強: 透過對現有資料進行變換（如旋轉、縮放、裁剪、顏色調整等）來增加資料集的多樣性。
合成資料: 使用資料合成技術生成新的訓練樣本，尤其是在資料稀缺的情況下。
資料探勘: 從網際網路或公共資料集中收集更多相關資料。
眾包: 利用眾包平臺收集和標註資料。
遷移學習: 使用預訓練模型作為起點，然後在較小的資料集上進行微調。
分層抽樣: 確保資料集中的每個類別都有足夠數量的樣本。
交叉驗證: 使用交叉驗證來更有效地利用有限的資料，同時評估模型的穩定性。
正則化技術: 如L1或L2正則化，以減少過擬合的風險。
早停法: 在驗證集上的效能不再提升時停止訓練，以避免過擬合。
調整模型複雜度: 根據資料集的大小調整模型的複雜度，以找到最佳的模型容量。

這裡，我們直接從資料集中劃分更多的資料作為訓練資料，同時，驗證集也增大

訓練集增大到30

for anno_path, video_path in zip(train_annos[:30], train_videos[:30]):
    print(video_path)
    anno_df = pd.read_json(anno_path)
    cap = cv2.VideoCapture(video_path)
    frame_idx = 0 
    while True:
        ret, frame = cap.read()
        if not ret:
            break

        img_height, img_width = frame.shape[:2]
        
        frame_anno = anno_df[anno_df['frame_id'] == frame_idx]
        cv2.imwrite('./yolo-dataset/train/' + anno_path.split('/')[-1][:-5] + '_' + str(frame_idx) + '.jpg', frame)

        if len(frame_anno) != 0:
            with open('./yolo-dataset/train/' + anno_path.split('/')[-1][:-5] + '_' + str(frame_idx) + '.txt', 'w') as up:
                for category, bbox in zip(frame_anno['category'].values, frame_anno['bbox'].values):
                    category_idx = category_labels.index(category)
                    
                    x_min, y_min, x_max, y_max = bbox
                    x_center = (x_min + x_max) / 2 / img_width
                    y_center = (y_min + y_max) / 2 / img_height
                    width = (x_max - x_min) / img_width
                    height = (y_max - y_min) / img_height

                    if x_center > 1:
                        print(bbox)
                    up.write(f'{category_idx} {x_center} {y_center} {width} {height}\n')
        
        frame_idx += 1

驗證集

for anno_path, video_path in zip(train_annos[-10:], train_videos[-10:]):
    print(video_path)
    anno_df = pd.read_json(anno_path)
    cap = cv2.VideoCapture(video_path)
    frame_idx = 0 
    while True:
        ret, frame = cap.read()
        if not ret:
            break

        img_height, img_width = frame.shape[:2]
        
        frame_anno = anno_df[anno_df['frame_id'] == frame_idx]
        cv2.imwrite('./yolo-dataset/val/' + anno_path.split('/')[-1][:-5] + '_' + str(frame_idx) + '.jpg', frame)

        if len(frame_anno) != 0:
            with open('./yolo-dataset/val/' + anno_path.split('/')[-1][:-5] + '_' + str(frame_idx) + '.txt', 'w') as up:
                for category, bbox in zip(frame_anno['category'].values, frame_anno['bbox'].values):
                    category_idx = category_labels.index(category)
                    
                    x_min, y_min, x_max, y_max = bbox
                    x_center = (x_min + x_max) / 2 / img_width
                    y_center = (y_min + y_max) / 2 / img_height
                    width = (x_max - x_min) / img_width
                    height = (y_max - y_min) / img_height

                    up.write(f'{category_idx} {x_center} {y_center} {width} {height}\n')
        
        frame_idx += 1

切換不同模型預訓練權重

先了解一下YOLO系列中常見的不同版本（s, m, l, x）的區別：

YOLO-S (Small): 這是YOLO系列中的小型版本，通常具有較少的引數和較低的計算需求。它適用於資源受限的環境，如移動裝置或嵌入式系統，但可能在檢測精度上有所犧牲。
YOLO-M (Medium): 中型版本提供了一個平衡點，它比小型版本有更多的引數和更高的計算需求，同時保持了較好的檢測精度和速度。
YOLO-L (Large): 大型版本擁有最多的引數和最高的計算需求。它提供了更高的檢測精度，但速度可能會慢於小型和中型版本。
YOLO-X (Extra Large): 這是YOLO系列中的超大型版本，它具有最多的引數和最高的計算需求。YOLO-X通常用於需要最高精度的場景，儘管它的速度可能不如其他版本快。

這裡選擇了YOLOv8s的預訓練模型

同時增加訓練回合

import os
os.environ["CUDA_VISIBLE_DEVICES"] = "0"

import warnings
warnings.filterwarnings('ignore')


from ultralytics import YOLO
# model = YOLO("yolov8n.pt")
model = YOLO("yolov8s.pt")
results = model.train(data="yolo-dataset/yolo.yaml", epochs=30, imgsz=1080, batch=16)

這是baseline的訓練日誌

這是最佳化以後的訓練日誌

可以看到：
泛化能力(dfl_loss)和準確性(cls_loss)都有提高

Datawhale AI 夏令營第五期 CV方向 01
2024-08-26
AI
Datawhale X 魔搭 AI夏令營 AIGC方向 Task3
2024-08-17
AIGC
Datawhale X 魔搭 AI夏令營 AIGC方向 Task1
2024-08-11
AIGC
Datawhale X 魔搭 AI夏令營-第四期(AIGC方向)-Task02-可圖Kolors-精讀程式碼實戰進階
2024-08-14
AIGC
Datawhale X 魔搭 AI夏令營(三)
2024-08-17
AI
Datawhale X 李宏毅蘋果書AI夏令營深度學習進階(三)
2024-09-02
蘋果AI深度學習
Datawhale X 李宏毅蘋果書AI夏令營深度學習進階(二)
2024-08-30
蘋果AI深度學習
Datawhale AI夏令營-機器翻譯挑戰賽
2024-07-17
AI
Datawhale X 魔搭 2024年AI夏令營第四期AIGC方向 Task01
2024-08-11
AIGC
[Datawhale AI 夏令營] Task1: 跑通YOLO方案baseline
2024-08-25
AIYOLO
Datawhale AI 暑期夏令營第四期Task3
2024-08-03
AI
Datawhale X 李宏毅蘋果書 AI夏令營 task2
2024-08-24
蘋果AI
Datawhale AI 夏令營-天池Better Synth多模態大模型資料合成挑戰賽-task2探索與進階(更新中)
2024-08-15
AI大模型
DataWhale暑期夏令營第一期——大模型技術方向task2筆記
2024-07-04
大模型筆記
2、實踐方法論（Datawhale X 李宏毅蘋果書 AI 夏令營）
2024-09-03
蘋果AI
Datawhale X 李宏毅蘋果書 AI夏令營 Task2筆記
2024-08-31
蘋果AI筆記
Datawhale X 李宏毅蘋果書 AI夏令營 Task1.2 筆記
2024-08-27
蘋果AI筆記
Datawhale X 李宏毅蘋果書 AI夏令營task1筆記
2024-08-24
蘋果AI筆記
Datawhale AI夏令營-第四期(AIGC方向)-Task01-可圖Kolors-LoRA風格故事挑戰賽
2024-08-09
AIGC
Datawhale X 李宏毅蘋果書AI夏令營 Task3打卡
2024-09-03
蘋果AI
Datawhale X 李宏毅蘋果書AI夏令營 Task2打卡
2024-08-31
蘋果AI
Datawhale Al夏令營——siRNA藥物藥效預測Transformer模型搭建嘗試
2024-08-03
ORM模型
Datawhale X 李宏毅蘋果書 AI夏令營:task1透過案例瞭解機器學習
2024-08-27
蘋果AI機器學習
DataWhale-2024夏令營第四期-從零入門AI生圖原理&實踐-學習筆記
2024-08-11
AI筆記
Java進階02 異常處理
2019-11-19
Java
無計算機基礎想進AI方向，可以透過以下幾個階段學習AI
2024-03-22
計算機AI
Datawhale X 李宏毅蘋果書 AI夏令營 Task3 批次歸一化、卷積神經網路、自注意力機制原理筆記
2024-09-02
蘋果AI卷積神經網路筆記
02--JS02--高階
2024-05-14
JS
SAP CV02N 審批一個文件
2021-01-14
.NET進階篇02-Delegate委託、Event事件
2019-10-26
事件
小菜鳥的實習進階歷程day02
2020-10-22
ChatGPT進階指南——營銷小助手
2023-02-28
ChatGPT
【eBPF-02】入門：基於 BCC 框架的程式進階
2023-12-28
eBPF框架
考研保研、夏令營推免的簡歷模板
2023-12-15
中山大學人工智慧夏令營實踐課
2024-07-16
人工智慧
讀AI未來進行式筆記02深度偽造
2024-06-04
AI筆記
擼碼兩三年，這是值得你去進階的方向
2018-11-23
2024廈門大學數學夏令營考核試題
2024-07-27

Datawhale AI 夏令營 第五期 CV方向 02進階

增加訓練資料集

切換不同模型預訓練權重

相關文章

Datawhale AI 夏令營第五期 CV方向 02進階