簡單介紹python深度學習tensorflow例項資料下載與讀取

大雄45發表於2022-07-17
導讀 這篇文章主要為大家介紹了python深度學習tensorflow例項資料下載與讀取示例詳解,有需要的朋友可以借鑑參考下,希望能夠有所幫助,祝大家多多進步,早日升職加薪
一、mnist資料

深度學習的入門例項,一般就是mnist手寫數字分類識別,因此我們應該先下載這個資料集。

tensorflow提供一個input_data.py檔案,專門用於下載mnist資料,我們直接呼叫就可以了,程式碼如下:

import tensorflow.examples.tutorials.mnist.input_data
mnist = input_data.read_data_sets("MNIST_data/", one_hot=True)

執行完成後,會在當前目錄下新建一個資料夾MNIST_data, 下載的資料將放入這個資料夾內。下載的四個檔案為:

簡單介紹python深度學習tensorflow例項資料下載與讀取簡單介紹python深度學習tensorflow例項資料下載與讀取

input_data檔案會呼叫一個maybe_download函式,確保資料下載成功。這個函式還會判斷資料是否已經下載,如果已經下載好了,就不再重複下載。

下載下來的資料集被分三個子集:5.5W行的訓練資料集(mnist.train),5千行的驗證資料集(mnist.validation)和1W行的測試資料集(mnist.test)。因為每張圖片為28x28的黑白圖片,所以每行為784維的向量。

每個子集都由兩部分組成:圖片部分(images)和標籤部分(labels), 我們可以用下面的程式碼來檢視 :

print mnist.train.images.shape
print mnist.train.labels.shape
print mnist.validation.images.shape
print mnist.validation.labels.shape
print mnist.test.images.shape
print mnist.test.labels.shape

如果想在spyder編輯器中檢視具體數值,可以將這些資料提取為變數來檢視,如:

val_data=mnist.validation.images
val_label=mnist.validation.labels
二、CSV資料

除了mnist手寫字型圖片資料,tf還提供了幾個csv的資料供大家練習,存放路徑為:

/home/xxx/anaconda3/lib/python3.5/site-packages/tensorflow/contrib/learn/python/learn/datasets/data/text_train.csv

如果要將這些資料讀出來,可用程式碼:

import tensorflow.contrib.learn.python.learn.datasets.base as base
iris_data,iris_label=base.load_iris()
house_data,house_label=base.load_boston()

前者為iris鳶尾花卉資料集,後者為波士頓房價資料。

三、cifar10資料

tf提供了cifar10資料的下載和讀取的函式,我們直接呼叫就可以了。執行下列程式碼:

import tensorflow.models.image.cifar10.cifar10 as cifar10
cifar10.maybe_download_and_extract()
images, labels = cifar10.distorted_inputs()
print images
print labels

就可以將cifar10下載並讀取出來。

以上就是python深度學習tensorflow例項資料下載與讀取的詳細內容。

原文來自:


來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/69955379/viewspace-2906102/,如需轉載,請註明出處,否則將追究法律責任。

相關文章