MXNet的資料格式轉化為tensorflow訓練用的資料格式
1 介紹
本文將mxNet的資料格式轉化為tensorflow訓練用的資料格式。
2 匯入包
import mxnet as mx
import argparse
import PIL.Image
import io
import numpy as np
import cv2
import tensorflow as tf
import os
3 主函式
if __name__ == '__main__': # define parameters id2range = {} data_shape = (3, 112, 112) args = parse_args() #idx_path放的是索引;args.bin_path放的是值,讀取的話imgrec是一個IO的物件,可以理解為C++裡面的類物件,類物件裡面有很多成員; # 比如有成員代表索引,成員代表索引對應的值得等。keys的len代表索引的數量 imgrec = mx.recordio.MXIndexedRecordIO(args.idx_path, args.bin_path, 'r')#索引長度5898396,也就是idx的長度 s = imgrec.read_idx(0)#讀取最開始那個索引對應的key_value,不過s是二進位制形式的 header, _ = mx.recordio.unpack(s)#header這裡儲存的是分成2斷的索引(key),這個時候不關心對應的資料資料,key是(5822653,5898396)的這一對索引 #(0,5822653)(5822653,5898396)這樣把資料分成兩段 print(header.label)#header.label就是(5822653,5898396) #下面是分成兩段 imgidx = list(range(1, int(header.label[0]))) seq_identity = range(int(header.label[0]), int(header.label[1])) for identity in seq_identity:#處理後面那段資料 s = imgrec.read_idx(identity) header, _ = mx.recordio.unpack(s) a, b = int(header.label[0]), int(header.label[1]) id2range[identity] = (a, b)#代表的是id為identity的起始索引從a到b,[a,b) print('id2range', len(id2range)) # # generate tfrecords mx2tfrecords(imgidx, imgrec, args) |
4 轉化函式
def mx2tfrecords(imgidx, imgrec, args):#從(0,5822653)的圖片 output_path = os.path.join(args.tfrecords_file_path, 'tran.tfrecords') writer = tf.python_io.TFRecordWriter(output_path) for i in imgidx: img_info = imgrec.read_idx(i)#取出第i張圖片,包括索引和圖片資料 header, img = mx.recordio.unpack(img_info)#解封 label = int(header.label)#取出這張圖片的標籤 example = tf.train.Example(features=tf.train.Features(feature={ 'image_raw': tf.train.Feature(bytes_list=tf.train.BytesList(value=[img])), "label": tf.train.Feature(int64_list=tf.train.Int64List(value=[label])) }))#把這張圖片的標籤和圖片資料都存下來 writer.write(example.SerializeToString()) # Serialize To String if i % 10000 == 0: print('%d num image processed' % i) writer.close() |
5 關於資料
本文例子中用到的資料可以私聊我要,畢竟是需要時間成本的,隨便發個紅包大小隨意。
歡迎大家關注和轉發本公眾號:facefinetune
相關文章
- mxnet資料格式轉換為tensorflow,pytorch資料PyTorch
- Mxnet R FCN 訓練自己的資料集
- Mxnet-R-FCN-訓練自己的資料集
- Hive資料格式轉換Hive
- 把JSON資料格式轉換為Python的類物件JSONPython物件
- json_encode的資料格式化的兩種格式[]和{}JSON
- 用兩種方法把JSON資料格式轉換為Python的類物件JSONPython物件
- layui tree資料格式轉換UI
- 如何使資料庫中取出的資料保持原有格式(轉)資料庫
- 資料的採集,清洗,資料機器自動標註及轉化為深度學習格式深度學習
- 使用Visual Studio將JSON格式資料自動轉化為對應的類JSON
- 電腦誤格式化的資料怎麼恢復,誤格式化資料恢復教程資料恢復
- 匯出資料為csv格式
- MySQL 匯出資料為csv格式的方法MySql
- 資料包格式
- 處理json格式的資料JSON
- 用《Excel》玩轉格式,輕鬆分析龐大資料!Excel大資料
- u盤格式化後怎麼恢復資料,怎麼恢復格式化U盤的資料
- C++資料格式化4 - 格式化時間戳C++時間戳
- hrsc2016資料集xml格式轉換為yolo格式,附下載連結XMLYOLO
- c語言中資料的格式化輸出C語言
- Oracle資料庫日期格式轉換操作Oracle資料庫
- .net接收post請求並把資料轉為字典格式
- MxNet預訓練模型到Pytorch模型的轉換模型PyTorch
- sqlserver資料庫日期如何格式化-日期轉換字串SQLServer資料庫字串
- 硬碟格式化後資料能不能恢復,硬碟格式化資料怎麼恢復硬碟
- Oracle資料塊格式Oracle
- GEOJSON資料格式解析JSON
- PHP 轉換 SM2 加密資料 ASN1 編碼格式為 C1C3C2 格式資料PHP加密
- 從已格式化硬碟救回刪除的資料硬碟
- Windows10 使用 Tensorflow Object_detection API 訓練自己的資料WindowsObjectAPI
- iPhone 的健康資料採用的是 FHIR 傳輸格式iPhone
- ABAP和XML資料格式互相轉換的兩種方式XML
- 如何檢視tensorflow SavedModel格式模型的資訊模型
- keras-retinanet 用自己的資料集訓練KerasNaN
- 用SSD-Pytorch訓練自己的資料集PyTorch
- 簡單操作,用excel或者vscode為多行資料新增格式ExcelVSCode
- word轉化為markdown格式