輕鬆學Pytorch-使用ResNet50實現影像分類
磐創AI分享
磐創AI分享
來源 | OpenCV學堂
作者 | gloomyfish
Hello大家好,這篇文章給大家詳細介紹一下pytorch中最重要的元件torchvision,它包含了常見的資料集、模型架構與預訓練模型權重檔案、常見影像變換、計算機視覺任務訓練。可以是說是pytorch中非常有用的模型遷移學習神器。本文將會介紹如何使用torchvison的預訓練模型ResNet50實現影像分類。
模型
Torchvision.models包裡面包含了常見的各種基礎模型架構,主要包括:
AlexNet
VGG
ResNet
SqueezeNet
DenseNet
Inception v3
GoogLeNet
ShuffleNet v2
MobileNet v2
ResNeXt
Wide ResNet
MNASNet
這裡我選擇了ResNet50,基於ImageNet訓練的基礎網路來實現影像分類, 網路模型下載與載入如下:
model = torchvision.models.resnet50(pretrained=True).eval().cuda()
tf = transforms.Compose([
transforms.Resize(256),
transforms.CenterCrop(224),
transforms.ToTensor(),
transforms.Normalize(
mean=[0.485, 0.456, 0.406],
std=[0.229, 0.224, 0.225]
)])
使用模型實現影像分類
這裡首先需要載入ImageNet的分類標籤,目的是最後顯示分類的文字標籤時候使用。然後對輸入影像完成預處理,使用ResNet50模型實現分類預測,對預測結果解析之後,顯示標籤文字,完整的程式碼演示如下:
1with open('imagenet_classes.txt') as f:
2 labels = [line.strip() for line in f.readlines()]
3
4src = cv.imread("D:/images/space_shuttle.jpg") # aeroplane.jpg
5image = cv.resize(src, (224, 224))
6image = np.float32(image) / 255.0
7image[:,:,] -= (np.float32(0.485), np.float32(0.456), np.float32(0.406))
8image[:,:,] /= (np.float32(0.229), np.float32(0.224), np.float32(0.225))
9image = image.transpose((2, 0, 1))
10input_x = torch.from_numpy(image).unsqueeze(0)
11print(input_x.size())
12pred = model(input_x.cuda())
13pred_index = torch.argmax(pred, 1).cpu().detach().numpy()
14print(pred_index)
15print("current predict class name : %s"%labels[pred_index[0]])
16cv.putText(src, labels[pred_index[0]], (50, 50), cv.FONT_HERSHEY_SIMPLEX, 1.0, (0, 0, 255), 2)
17cv.imshow("input", src)
18cv.waitKey(0)
19cv.destroyAllWindows()
執行結果如下:
轉ONNX支援
在torchvision中的模型基本上都可以轉換為ONNX格式,而且被OpenCV DNN模組所支援,所以,很方便的可以對torchvision自帶的模型轉為ONNX,實現OpenCV DNN的呼叫,首先轉為ONNX模型,直接使用torch.onnx.export即可轉換(還不知道怎麼轉,快點看前面的例子)。轉換之後使用OpenCV DNN呼叫的程式碼如下:
1with open('imagenet_classes.txt') as f:
2 labels = [line.strip() for line in f.readlines()]
3net = cv.dnn.readNetFromONNX("resnet.onnx")
4src = cv.imread("D:/images/messi.jpg") # aeroplane.jpg
5image = cv.resize(src, (224, 224))
6image = np.float32(image) / 255.0
7image[:, :, ] -= (np.float32(0.485), np.float32(0.456), np.float32(0.406))
8image[:, :, ] /= (np.float32(0.229), np.float32(0.224), np.float32(0.225))
9blob = cv.dnn.blobFromImage(image, 1.0, (224, 224), (0, 0, 0), False)
10net.setInput(blob)
11probs = net.forward()
12index = np.argmax(probs)
13cv.putText(src, labels[index], (50, 50), cv.FONT_HERSHEY_SIMPLEX, 1.0, (0, 0, 255), 2)
14cv.imshow("input", src)
15cv.waitKey(0)
16cv.destroyAllWindows()
執行結果見上圖,這裡就不再貼了。
來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/31555081/viewspace-2705514/,如需轉載,請註明出處,否則將追究法律責任。
相關文章
- 使用EasyCV Mask2Former輕鬆實現影像分割ORM
- 使用PaddleFluid和TensorFlow實現影像分類網路SE_ResNeXtUI
- 在 Fedora 上使用 GIMP 輕鬆編輯影像
- 在Mac上使用Photoshop 2022:輕鬆實現影像處理,PS Mac軟體下載Mac
- 「影像分類」 實戰影像分類網路的視覺化視覺化
- 使用 CSS 輕鬆實現高頻出現的各類奇形怪狀按鈕CSS
- torch--多層感知機實現影像分類
- 使用 express 輕鬆實現反向代理伺服器Express伺服器
- 使用 offline-plugin 搭配 webpack 輕鬆實現 PWAPluginWeb
- 20 行程式碼:Serverless 架構下用 Python 輕鬆搞定影像分類和預測行程Server架構Python
- 輕鬆編輯影像資訊
- 手把手教你使用LabVIEW OpenCV dnn實現影像分類(含原始碼)ViewOpenCVDNN原始碼
- 輕鬆實現報表整合
- SpringBoot+mail 輕鬆實現各類郵件自動推送Spring BootAI
- 還在被大媽靈魂拷問?使用Python輕鬆完成垃圾分類!Python
- 基於Tensorflow + Opencv 實現CNN自定義影像分類OpenCVCNN
- 輕鬆理解分庫分表
- 10 分鐘輕鬆學會 Jackson 反序列化自動適配子類
- 5分鐘輕鬆學正規表示式
- 輕鬆實現 Web 效能優化Web優化
- 輕鬆實現在家高效辦公
- ResNet50的貓狗分類訓練及預測
- 整合華為Image Kit影像主題標籤功能 輕鬆整理400+圖片場景的分類
- Redis輕鬆實現秒殺系統Redis
- 使用Kotlin (Spring Boot) + MockMVC + DatabaseRider輕鬆實現API整合測試KotlinSpring BootMockMVCDatabaseIDEAPI
- 看照片挑民宿:Airbnb如何重新訓練ResNet50,實現房間圖片分類最佳化AI
- 使用普通攝像頭,輕鬆實現精準動作捕捉能力
- 用Redis輕鬆實現秒殺系統Redis
- Flutter輕鬆實現Adobe全家桶Logo列表FlutterGo
- [轉]Android輕鬆實現RecyclerView懸浮條AndroidView
- 知識分享 | 輕鬆實現優質建模
- 使用jupyter實現貓和狗的分類
- 實戰 | 使用maven 輕鬆重構專案Maven
- SpringBoot實戰:輕鬆實現介面資料脫敏Spring Boot
- 演算法影像崗-影像分類與影像分割演算法
- 輕輕鬆鬆實現本地和雲主機之間的檔案上傳下載
- 輕鬆理解JVM的分代模型JVM模型
- ArcGIS中的影像分類