實踐案例丨CenterNet-Hourglass論文復現

華為雲開發者聯盟發表於2022-12-05

原文網址 : https://www.cnblogs.com/huaweiyun/p/16952367.html

摘要：本案例是CenterNet-Hourglass論文復現的體驗案例，此模型是對Objects as Points 中提出的CenterNet進行結果復現。

本文分享自華為雲社群《CenterNet-Hourglass (物體檢測/Pytorch)》，作者：HWCloudAI。

目標檢測常採用Anchor的方法來獲取物體可能存在的位置，再對該位置進行分類，這樣的做法耗時、低效，同時需要後處理（比如NMS）。CenterNet將目標看成一個點，即目標bounding box的中心點，整個問題轉變成了關鍵點估計問題，其他目標屬性，比如尺寸、3D位置、方向和姿態等都以估計的中心點為基準進行引數迴歸。

本案例是CenterNet-Hourglass論文復現的體驗案例，此模型是對Objects as Points 中提出的CenterNet進行結果復現（原論文Table 2 最後一行）。本模型是以Hourglass網路架構作為backbone，以ExtremNet 作為預訓練模型，在COCO資料集上進行50epochs的訓練後得到的。本專案是基於原論文的官方程式碼進行針對ModelArts平臺的修改來實現ModelArts上的訓練與部署。

具體演算法介紹：https://marketplace.huaweicloud.com/markets/aihub/modelhub/detail/?id=380f95a6-1552-4128-ac96-36066258853f

注意事項：

1.本案例使用框架:PyTorch1.4.0

2.本案例使用硬體:GPU: 1*NVIDIA-V100NV32(32GB) | CPU: 8 核 64GB

3.執行程式碼方法: 點選本頁面頂部選單欄的三角形執行按鈕或按Ctrl+Enter鍵執行每個方塊中的程式碼

4.JupyterLab的詳細用法: 請參考《ModelAtrs JupyterLab使用指導》

5.碰到問題的解決辦法:請參考《ModelAtrs JupyterLab常見問題解決辦法》

1.下載資料和程式碼

執行下面程式碼，進行資料和程式碼的下載和解壓

本案例使用COCO資料集。

import os
#資料程式碼下載
!wget https://obs-aigallery-zc.obs.cn-north-4.myhuaweicloud.com/algorithm/CenterNet.zip
# 解壓縮
os.system('unzip  CenterNet.zip -d ./')

--2021-06-25 17:50:11--  https://obs-aigallery-zc.obs.cn-north-4.myhuaweicloud.com/algorithm/CenterNet.zip
Resolving proxy-notebook.modelarts.com (proxy-notebook.modelarts.com)... 192.168.6.62
Connecting to proxy-notebook.modelarts.com (proxy-notebook.modelarts.com)|192.168.6.62|:8083... connected.
Proxy request sent, awaiting response... 200 OK
Length: 1529663572 (1.4G) [application/zip]
Saving to: ‘CenterNet.zip’
CenterNet.zip       100%[===================>] 1.42G   279MB/s    in 5.6s
2021-06-25 17:50:16 (261 MB/s) - ‘CenterNet.zip’ saved [1529663572/1529663572]
0

2.訓練

2.1依賴庫載入和安裝

from __future__ import absolute_import
from __future__ import division
from __future__ import print_function
root_path = './CenterNet/'
os.chdir(root_path)
os.system('pip install pycocotools')
import _init_paths
import torch
import torch.utils.data
from opts import opts
from models.model import create_model, load_model, save_model
from models.data_parallel import DataParallel
from logger import Logger
from datasets.dataset_factory import get_dataset
from trains.train_factory import train_factory
from evaluation import test, prefetch_test, image_infer
USE_MODELARTS = True
INFO:root:Using MoXing-v2.0.0.rc0-19e4d3ab
INFO:root:Using OBS-Python-SDK-3.20.9.1
NMS not imported! If you need it, do 
 cd $CenterNet_ROOT/src/lib/external 
 make

2.2訓練函式

def main(opt):
 torch.manual_seed(opt.seed)
 torch.backends.cudnn.benchmark = not opt.not_cuda_benchmark and not opt.test
  Dataset = get_dataset(opt.dataset, opt.task)
  opt = opts().update_dataset_info_and_set_heads(opt, Dataset)
  logger = Logger(opt)
 os.environ['CUDA_VISIBLE_DEVICES'] = opt.gpus_str
 opt.device = torch.device('cuda' if opt.gpus[0] >= 0 else 'cpu') 
 print('Creating model...')
  model = create_model(opt.arch, opt.heads, opt.head_conv)
  optimizer = torch.optim.Adam(model.parameters(), opt.lr)
 start_epoch = 0
 if opt.load_model != '':
    model, optimizer, start_epoch = load_model(
      model, opt.load_model, optimizer, opt.resume, opt.lr, opt.lr_step)
  Trainer = train_factory[opt.task]
  trainer = Trainer(opt, model, optimizer)
 trainer.set_device(opt.gpus, opt.chunk_sizes, opt.device)
 print('Setting up data...')
 train_loader = torch.utils.data.DataLoader(
 Dataset(opt, 'train'), 
 batch_size=opt.batch_size, 
      shuffle=True,
 num_workers=opt.num_workers,
 pin_memory=True,
 drop_last=True
 )
 print('Starting training...')
  best = 1e10
 for epoch in range(start_epoch + 1, opt.num_epochs + 1):
    mark = epoch if opt.save_all else 'last'
 log_dict_train, _ = trainer.train(epoch, train_loader)
 logger.write('epoch: {} |'.format(epoch))
 for k, v in log_dict_train.items():
 logger.scalar_summary('train_{}'.format(k), v, epoch)
 logger.write('{} {:8f} | '.format(k, v))
 save_model(os.path.join(opt.save_dir, 'model_last.pth'), 
                 epoch, model)
 logger.write('\n')
 if epoch in opt.lr_step:
 save_model(os.path.join(opt.save_dir, 'model_{}.pth'.format(epoch)), 
                 epoch, model, optimizer)
 lr = opt.lr * (0.1 ** (opt.lr_step.index(epoch) + 1))
 print('Drop LR to', lr)
 for param_group in optimizer.param_groups:
 param_group['lr'] = lr
 logger.close()

2.3開始訓練

訓練需要一點時間，請耐心等待

if __name__ == '__main__':
  opt = opts().parse()
 if USE_MODELARTS:
 pwd = os.getcwd()
 print('Copying dataset to work space...')
 print('Listing directory: ')
 print(os.listdir())
 if not os.path.exists(opt.save_dir):
 os.makedirs(opt.save_dir)
  main(opt)
 if USE_MODELARTS:
 print("Processing model checkpoints & service config for deployment...")
 if not opt.eval:
 infer_dir = os.path.join(opt.save_dir, 'model')
 os.makedirs(infer_dir)
 os.system(f'mv ./trained_model/* {infer_dir}')
 pretrained_pth = os.path.join(infer_dir, '*.pth')
 ckpt_dir = os.path.join(opt.save_dir, 'checkpoints')
 os.makedirs(ckpt_dir)
 os.system(f'mv {pretrained_pth} {ckpt_dir}')
 pth_files = os.path.join(opt.save_dir, '*.pth')
 infer_pth = os.path.join(ckpt_dir, f'{opt.model_deploy}.pth')
 os.system(f'mv {pth_files} {ckpt_dir}')
 os.system(f'mv {infer_pth} {infer_dir}')
 print(os.listdir(opt.save_dir))
 print("ModelArts post-training work is done!")
Fix size testing.
training chunk_sizes: [8]
The output will be saved to  ./output/exp/ctdet/default
Copying dataset to work space...
Listing directory: 
['pre-trained_weights', '.ipynb_checkpoints', 'coco_eval.py', 'train.py', 'coco', 'output', 'training_logs', 'trained_model', '_init_paths.py', '__pycache__', 'coco_classes.py', 'lib', 'evaluation.py']
heads {'hm': 80, 'wh': 2, 'reg': 2}
Creating model...
loaded ./trained_model/epoch_50_mAP_42.7.pth, epoch 50
Setting up data...
==> initializing coco 2017 train data.
loading annotations into memory...
Done (t=0.54s)
creating index...
index created!
Loaded train 5000 samples
Starting training...
/home/ma-user/anaconda3/envs/Pytorch-1.4.0/lib/python3.6/site-packages/torch/nn/_reduction.py:43: UserWarning: size_average and reduce args will be deprecated, please use reduction='sum' instead.
 warnings.warn(warning.format(ret))
ctdet/default| train: [1][0/625] |loss 1.7568 |hm_loss 1.3771 |wh_loss 1.9394 |off_loss 0.1857 |Data 0.384s (0.384s) |Net 5.019s (5.019s)
ctdet/default| train: [1][200/625] |loss 1.9275 |hm_loss 1.4429 |wh_loss 2.7269 |off_loss 0.2119 |Data 0.001s (0.003s) |Net 0.759s (0.779s)
ctdet/default| train: [1][400/625] |loss 1.9290 |hm_loss 1.4430 |wh_loss 2.7423 |off_loss 0.2118 |Data 0.001s (0.002s) |Net 0.760s (0.770s)
ctdet/default| train: [1][600/625] |loss 1.9276 |hm_loss 1.4397 |wh_loss 2.7623 |off_loss 0.2117 |Data 0.001s (0.002s) |Net 0.765s (0.767s)
Processing model checkpoints & service config for deployment...
['model', 'logs_2021-06-25-17-51', 'opt.txt', 'checkpoints']
ModelArts post-training work is done!

3.模型測試

3.1推理函式

# -*- coding: utf-8 -*-
# TODO 新增模型執行需要匯入的模組
import os
import torch
import numpy as np
from PIL import Image
from io import BytesIO
from collections import OrderedDict
import cv2
import sys
sys.path.insert(0, './lib')
from opts import opts
from coco_classes import coco_class_map
from detectors.detector_factory import detector_factory
class ModelClass():
 def __init__(self, model_path):
 self.model_path = model_path # 本行程式碼必須保留，且無需修改
 self.opt = opts().parse()
 self.opt.num_classes = 80
 self.opt.resume = True
 self.opt.keep_res = True
 self.opt.fix_res = False
 self.opt.heads = {'hm': 80, 'wh': 2, 'reg': 2}
 self.opt.load_model = model_path
 self.opt.mean = np.array([0.40789654, 0.44719302, 0.47026115],
 dtype=np.float32).reshape(1, 1, 3)
 self.opt.std = np.array([0.28863828, 0.27408164, 0.27809835],
 dtype=np.float32).reshape(1, 1, 3)
 self.opt.batch_infer = False
 # configurable varibales:
 if 'BATCH_INFER' in os.environ:
 print('Batch inference mode!')
 self.opt.batch_infer = True
 if 'FLIP_TEST' in os.environ:
 print('Flip test!')
 self.opt.flip_test = True
 if 'MULTI_SCALE' in os.environ:
 print('Multi scale!')
 self.opt.test_scales = [0.5,0.75,1,1.25,1.5]
 self.device = torch.device("cuda" if torch.cuda.is_available() else "cpu")
 if not torch.cuda.is_available():
 self.opt.gpus = [-1]
 self.class_map = coco_class_map()
 torch.set_grad_enabled(False)
        Detector = detector_factory[self.opt.task]
 self.detector = Detector(self.opt)
 print('load model success')
 def predict(self, file_name):
        image = Image.open(file_name).convert('RGB')
 img = np.array(image)
 img = img[:, :, ::-1]
        results = self.detector.run(img)['results']
        image = cv2.cvtColor(np.asarray(image),cv2.COLOR_RGB2BGR)
 if not self.opt.batch_infer:
 for c_id, dets in results.items():
 for det in dets:
 if det[4] > self.opt.vis_thresh:
                        scores = str(round(float(det[4]), 4))
                        classes = self.class_map[c_id]
                        image = cv2.rectangle(image,(int(det[0]),int(det[1])),(int(det[2]),int(det[3])),(0,255,0),2)
                        image = cv2.putText(image,classes+':'+scores,(int(det[0]),int(det[1])),cv2.FONT_HERSHEY_SIMPLEX,0.7,(0,0,255),2)
 else:
 for c_id, dets in results.items():
 for det in dets:
                    scores = str(round(float(det[4]), 4))
                    classes = self.class_map[c_id]
                    image = cv2.rectangle(image,(int(det[0]),int(det[1])),(int(det[2]),int(det[3])),(0,255,0),2)
                    image = cv2.putText(image,classes+':'+scores,(int(det[0]),int(det[1])),cv2.FONT_HERSHEY_SIMPLEX,0.5,(0,0,255),2)
 return image

3.2開始推理

可以自行修改預測的影像路徑

if __name__ == '__main__':
 import matplotlib.pyplot as plt
 img_path = './coco/train/000000021903.jpg' 
 model_path = './output/exp/ctdet/default/model/model_last.pth' #模型的儲存路徑，你可以自己找一下
 # 以下程式碼無需修改
 my_model = ModelClass(model_path)
    result = my_model.predict(img_path)
    result = Image.fromarray(cv2.cvtColor(result,cv2.COLOR_BGR2RGB))
 plt.figure(figsize=(10,10)) #設定視窗大小
 plt.imshow(result)
 plt.show()

Fix size testing.
training chunk_sizes: [8]
The output will be saved to  ./output/exp/ctdet/default
Creating model...
loaded ./output/exp/ctdet/default/model/model_last.pth, epoch 1
load model success

點選關注，第一時間瞭解華為雲新鮮技術~

論文復現丨基於ModelArts實現Text2SQL
2022-12-27
SQL
Split to Be Slim: 論文復現
2023-04-24
實踐心得：從讀論文到復現到為開源貢獻程式碼
2018-05-18
論文Anonymous Zether實驗復現（持續更）
2020-11-14
論文復現丨基於ModelArts進行影像風格化繪畫
2022-12-22
LEARNED STEP SIZE QUANTIZATION論文復現
2020-10-15
ICML 2017大熱論文：Wasserstein GAN | 經典論文復現
2018-10-31
一文詳解ATK Loss論文復現與程式碼實戰
2023-02-27
論文復現｜Panoptic Deeplab(全景分割PyTorch)
2022-11-24
PyTorch
Squarified Treemaps 論文演算法復現
2020-11-28
演算法
R-Drop論文復現與理論講解
2023-03-07
java實現論文查重
2024-03-15
Java
自監督影像論文復現 | BYOL（pytorch）| 2020
2021-01-30
PyTorch
前端實操案例丨如何實現JS向Vue傳值
2021-05-19
前端JSVue
實踐案例丨雲連線CC實現跨區域多VPC與線下IDC Server互聯
2020-09-16
Server
Perceptual Losses 風格遷移論文復現小記
2023-10-16
FCOS論文復現：通用物體檢測演算法
2022-11-28
演算法
小白經典CNN論文復現系列（一）：LeNet1989
2020-12-29
CNN
Android 常見安全漏洞修復理論與實踐
2019-06-16
Android
案例實踐丨基於SkyWalking全鏈路監控的微服務系統效能調優實踐篇
2023-09-13
微服務
論文結果圖：matplotlib和seaborn實現
2020-08-07
論文解讀丨表格識別模型TableMaster
2021-10-27
模型AST
手把手帶你復現ICCV 2017經典論文—PyraNet
2018-11-12
Flex Box 案例實踐
2018-11-19
Flex
經典論文復現 | 基於標註策略的實體和關係聯合抽取
2018-11-27
基於標註策略的實體和關係聯合抽取 | 經典論文復現
2019-02-15
安全建設實踐案例四連發（三）丨醫療衛生主管單位如何實現安全管理一盤棋？
2021-06-02
InfoGAN：一種無監督生成方法 | 經典論文復現
2018-10-29
COLING 2018 最佳論文解讀：序列標註經典模型復現
2018-07-02
模型
RMAN恢復實踐
2022-10-18
微服務實戰：服務發現的可行方案以及實踐案例
2018-11-24
微服務
購物網站的設計與實現論文
2022-03-17
網站
Nginx解析漏洞復現以及哥斯拉連線Webshell實踐
2021-03-03
NginxWebshell
2020西湖論劍Web復現
2020-11-01
Web
最佳實踐丨雲開發CloudBase多環境管理實踐
2021-11-24
Cloud
robust 熱修復實踐
2018-06-29
硬幣系列三 | 硬幣自動分類的一個論文復現
2020-07-13
安全建設實踐案例四連發（二）丨如何讓智慧醫院更有“安全感”？
2021-05-25