[譯] Google Colab 免費 GPU 使用教程

leeyang-tju發表於2018-12-04

原文網址 : https://flycode.co/archives/54199

原文地址：Google Colab Free GPU Tutorial

原文作者：fuat

譯文出自：掘金翻譯計劃

本文永久連結：github.com/xitu/gold-m…

譯者：haiyang-tju

校對者：DevMcryYu

Google Colab 免費 GPU 使用教程

現在你可以使用 Google Colaboratory（帶有免費的 Tesla K80 GPU）使用 Keras、Tensorflow 和 PyTorch 來開發深度學習的程式了。

大家好！我將向大家展示如何使用 Google 面向 AI 開發者的免費雲服務 —— Google Colab。在 Colab 上，你可以使用免費的 GPU 來開發深度學習應用程式。

感謝 KDnuggets！

我很高興地宣佈，這篇博文在 2018 年 2 月被選為 KDnuggets 的銀質博文！文章內容可以在 KDnuggets 看到。

Google Colab 是什麼？

Google Colab 是一個免費的雲服務，現在它還支援免費的 GPU！

你可以：

提高你的 Python 語言的編碼技能。
使用 Keras、TensorFlow、PyTorch 和 OpenCV 等流行庫開發深度學習應用程式。

Colab 與其它免費的雲服務最重要的區別在於：Colab 提供完全免費的 GPU。

關於這項服務的詳細資訊可以在 faq 頁面上找到。

準備好使用 Google Colab

在 Google Drive 上建立資料夾

由於 Colab 是在 Google Drive 上工作的，所以我們需要首先指定工作資料夾。我在 Google Drive 上建立了一個名為 “app” 的資料夾。當然，你可以使用不同的名稱或選擇預設的 Colab Notebooks 資料夾，而不是 app 資料夾。

我建立了一個空的 “app” 資料夾

建立新的 Colab 筆記（Notebook）

通過 右鍵點選 > More > Colaboratory 步驟建立一個新的筆記。

右鍵點選 > More > Colaboratory

通過點選檔名來重新命名筆記

設定免費的 GPU

通過很簡單的步驟就可以將預設硬體從 CPU 更改為 GPU，或者反過來。依照下面的步驟 Edit > Notebook settings 或者進入 Runtime > Change runtime type，然後選擇 GPU 作為 Hardware accelerator（硬體加速器）。

使用 Google Colab 執行基本的 Python 程式碼

現在我們可以開始使用 Google Colab 了。

我會執行一些 Python Numpy 教程中關於基本資料型別的程式碼。

可以正常執行！:) 如果你對在 AI 中最流行的程式語言 Python 還不是很瞭解，我推薦你去學習這個簡明教程。

在 Google Colab 中執行或匯入 .py 檔案

首先執行這些程式碼，以便安裝一些必要的庫並執行授權。

from google.colab import drive
drive.mount('/content/drive/')
複製程式碼

執行上面的程式碼，會得到如下的結果：

點選這個連結，複製驗證程式碼並貼上到下面的文字框中。

完成授權流程後，應該可以看到：

現在可以通過下面的命令訪問你的 Google Drive 了：

!ls "/content/drive/My Drive/"
複製程式碼

安裝 Keras：

!pip install -q keras
複製程式碼

上傳檔案 mnist_cnn.py 到你的 Google Drive 的 app 資料夾中。

mnist_cnn.py 檔案內容

在 MNIST 資料集上執行下面的程式碼來訓練一個簡單的卷積網路（convnet）。

!python3 "/content/drive/My Drive/app/mnist_cnn.py"
複製程式碼

從結果可以看到，每輪次（epoch）執行只用了 11 秒。

下載 Titanic 資料集（.csv 檔案）並顯示檔案的前 5 行內容

如果你想從一個 url 中下載 .csv 檔案到 “app” 資料夾，只需執行下面的命令：

!wget raw.githubusercontent.com/vincentarel… -P "/content/drive/My Drive/app"

不使用 wget 方法，你可以直接將自己的 .csv 檔案上傳到 “app” 資料夾中。

讀取 “app” 資料夾中的 .csv 檔案並顯示前 5 行的內容：

import pandas as pd
titanic = pd.read_csv(“/content/drive/My Drive/app/Titanic.csv”)
titanic.head(5)
複製程式碼

克隆 GitHub 倉庫到 Google Colab

使用 Git 可以很輕鬆克隆 GitHub 倉庫。

步驟 1: 找到 GitHub 倉庫並獲取 “Git” 連結

找到所需的 GitHub 倉庫。

比如： github.com/wxs/keras-m…

點選 Clone or download（克隆或下載） > Copy the link（複製連結）！

2. 使用 Git 克隆

執行以下命令即可：

!git clone github.com/wxs/keras-m…

3. 開啟 Google Drive 中對應的資料夾

當然，Google Drive 中對應的資料夾與 GitHub 倉庫名是相同的。

4. 開啟筆記

右鍵點選 > Open With > Colaboratory

5. 執行

現在你可以在 Google Colab 中執行 GitHub 倉庫程式碼了。

一些有用的提示

1. 如何安裝第三方庫？

Keras

!pip install -q keras
import keras
複製程式碼

PyTorch

from os import path
from wheel.pep425tags import get_abbr_impl, get_impl_ver, get_abi_tag
platform = '{}{}-{}'.format(get_abbr_impl(), get_impl_ver(), get_abi_tag())
accelerator = 'cu80' if path.exists('/opt/bin/nvidia-smi') else 'cpu'
複製程式碼

!pip install -q download.pytorch.org/whl/{accele… torchvision
import torch

或者試試這個：

!pip3 install torch torchvision

MxNet

!apt install libnvrtc8.0
!pip install mxnet-cu80
import mxnet as mx
複製程式碼

OpenCV

!apt-get -qq install -y libsm6 libxext6 && pip install -q -U opencv-python
import cv2
複製程式碼

XGBoost

!pip install -q xgboost==0.4a30
import xgboost
複製程式碼

GraphViz

!apt-get -qq install -y graphviz && pip install -q pydot
import pydot
複製程式碼

7zip 閱讀器

!apt-get -qq install -y libarchive-dev && pip install -q -U libarchive
import libarchive
複製程式碼

其它庫

!pip install 或者 !apt-get install 安裝其它庫。

2. GPU 是否正常工作？

要檢視是否在 Colab 中正確使用了 GPU，可以執行下面的程式碼進行交叉驗證：

import tensorflow as tf
tf.test.gpu_device_name()
複製程式碼

3. 我使用的是哪一個 GPU？

from tensorflow.python.client import device_lib
device_lib.list_local_devices()
複製程式碼

目前， Colab 只提供了 Tesla K80。

4. 輸出 RAM 資訊？

!cat /proc/meminfo
複製程式碼

5. 輸出 CPU 資訊？

!cat /proc/cpuinfo
複製程式碼

6. 改變工作資料夾

一般，當你執行下面的命令：

!ls
複製程式碼

你會看到 datalab 和 drive 資料夾。

因此，在定義每一個檔名時，需要在前面新增 drive/app。

要解決這個問題，更改工作目錄即可。（在本教程中，我將其更改為 app 資料夾）可以使用下面的程式碼：

import os
os.chdir("drive/app") 
# 譯者注：掛載網盤目錄後，前面沒有切換過目錄，這裡應該輸入
# os.chdir("drive/My Drive/app")
複製程式碼

執行上述程式碼後，如果你再次執行

!ls
複製程式碼

你會看到 app 資料夾的內容，不需要再一直新增 drive/app 了。

7. “`No backend with GPU available`” 錯誤解決方案

如果你遇到這個錯誤：

Failed to assign a backend No backend with GPU available. Would you like to use a runtime with no accelerator? #指定後端失敗。沒有可用的 GPU 後端。需要使用沒有加速器的執行時嗎？

可以稍後再試一次。有許多人現在都在使用 GPU，當所有 GPU 都在使用時，就會出現這種錯誤資訊。

參考這裡

8. 如何清空所有單元行的執行輸出？

可以依次點選 Tools>>Command Palette>>Clear All Outputs

9. “apt-key output should not be parsed (stdout is not a terminal)” 警告

如果你遇到這個警告：

Warning: apt-key output should not be parsed (stdout is not a terminal) #警告：apt-key 輸出無法被解析（當前 stdout 不是終端）
複製程式碼

這意味著你已經完成了授權。只需要掛載 Google Drive 即可：

!mkdir -p drive
!google-drive-ocamlfuse drive
複製程式碼

10. 如何在 Google Colab 中使用 Tensorboard？

我推薦參考這個倉庫程式碼：

github.com/mixuala/col…

11. 如何重啟 Google Colab？

要重啟（或重置）你開啟的虛擬機器器，執行下面的命令即可：

!kill -9 -1
複製程式碼

12. 如何向 Google Colab 中新增表單（Form）？

為了避免每次在程式碼中更改超引數，你可以簡單地向 Google Colab 中新增表單。

例如，我新增了一個包含有 learning_rate（學習率） 變數和 optimizer（優化器） 字串的表單。

13. 如何檢視方法的引數？

在 TensorFlow、Keras 等框架中檢視方法的引數，可以在方法名稱後面新增問號識別符號（?）：

這樣不需要點選 TensorFlow 的網站就可以看到原始文件。

14. 如何將大檔案從 Colab 傳送到 Google Drive？

# 需要傳送哪個檔案？
file_name = "REPO.tar"

from googleapiclient.http import MediaFileUpload
from googleapiclient.discovery import build

auth.authenticate_user()
drive_service = build('drive', 'v3')

def save_file_to_drive(name, path):
  file_metadata = {'name': name, 'mimeType': 'application/octet-stream'}
  media = MediaFileUpload(path, mimetype='application/octet-stream', resumable=True)
  created = drive_service.files().create(body=file_metadata, media_body=media, fields='id').execute()
  
  return created

save_file_to_drive(file_name, file_name)
複製程式碼

15. 如何在 Google Colab 中執行 Tensorboard？

如果你想在 Google Colab 中執行 Tensorboard，執行下面的程式碼。

# 你可以更改目錄名
LOG_DIR = 'tb_logs'

!wget https://bin.equinox.io/c/4VmDzA7iaHb/ngrok-stable-linux-amd64.zip
!unzip ngrok-stable-linux-amd64.zip

import os
if not os.path.exists(LOG_DIR):
  os.makedirs(LOG_DIR)
  
get_ipython().system_raw(
    'tensorboard --logdir {} --host 0.0.0.0 --port 6006 &'
    .format(LOG_DIR))

get_ipython().system_raw('./ngrok http 6006 &')

!curl -s http://localhost:4040/api/tunnels | python3 -c \
    "import sys, json; print(json.load(sys.stdin)['tunnels'][0]['public_url'])"
複製程式碼

你可以通過建立 ngrok.io 連結來追蹤 Tensorboard 日誌。你可以在輸出的最後找到這個 URL 連結。

注意，你的 Tensorboard 日誌將儲存到 tb_logs 目錄。當然，你可以更改這個目錄名。

之後，我們就可以看到 Tensorboard 了！執行下面的程式碼，可以通過 ngrok URL 連結來追蹤 Tensorboard 日誌。

from __future__ import print_function
import keras
from keras.datasets import mnist
from keras.models import Sequential
from keras.layers import Dense, Dropout, Flatten
from keras.layers import Conv2D, MaxPooling2D
from keras import backend as K
from keras.callbacks import TensorBoard

batch_size = 128
num_classes = 10
epochs = 12

# 輸入影象維度
img_rows, img_cols = 28, 28

# the data, shuffled and split between train and test sets
(x_train, y_train), (x_test, y_test) = mnist.load_data()

if K.image_data_format() == 'channels_first':
    x_train = x_train.reshape(x_train.shape[0], 1, img_rows, img_cols)
    x_test = x_test.reshape(x_test.shape[0], 1, img_rows, img_cols)
    input_shape = (1, img_rows, img_cols)
else:
    x_train = x_train.reshape(x_train.shape[0], img_rows, img_cols, 1)
    x_test = x_test.reshape(x_test.shape[0], img_rows, img_cols, 1)
    input_shape = (img_rows, img_cols, 1)

x_train = x_train.astype('float32')
x_test = x_test.astype('float32')
x_train /= 255
x_test /= 255
print('x_train shape:', x_train.shape)
print(x_train.shape[0], 'train samples')
print(x_test.shape[0], 'test samples')

# 將類別向量轉換成二分類矩陣
y_train = keras.utils.to_categorical(y_train, num_classes)
y_test = keras.utils.to_categorical(y_test, num_classes)

model = Sequential()
model.add(Conv2D(32, kernel_size=(3, 3),
                 activation='relu',
                 input_shape=input_shape))
model.add(Conv2D(64, (3, 3), activation='relu'))
model.add(MaxPooling2D(pool_size=(2, 2)))
model.add(Dropout(0.25))
model.add(Flatten())
model.add(Dense(128, activation='relu'))
model.add(Dropout(0.5))
model.add(Dense(num_classes, activation='softmax'))

model.compile(loss=keras.losses.categorical_crossentropy,
              optimizer=keras.optimizers.Adadelta(),
              metrics=['accuracy'])


tbCallBack = TensorBoard(log_dir=LOG_DIR, 
                         histogram_freq=1,
                         write_graph=True,
                         write_grads=True,
                         batch_size=batch_size,
                         write_images=True)

model.fit(x_train, y_train,
          batch_size=batch_size,
          epochs=epochs,
          verbose=1,
          validation_data=(x_test, y_test),
          callbacks=[tbCallBack])
score = model.evaluate(x_test, y_test, verbose=0)
print('Test loss:', score[0])
print('Test accuracy:', score[1])
複製程式碼

Tensorboard :)

總結

我認為 Colab 會給全世界的深度學習和 AI 研究帶來新的氣息。

如果你發現了這篇文章很有幫助，那麼請給它一些掌聲 ?，並與他人分享，這將會非常有意義。歡迎在下面留言。

你可以在 Twitter 上找到我。

最後請注意

英文原文會持續跟進更新，如有需要請移步英文原文。

如果發現譯文存在錯誤或其他需要改進的地方，歡迎到掘金翻譯計劃對譯文進行修改並 PR，也可獲得相應獎勵積分。文章開頭的 本文永久連結 即為本文在 GitHub 上的 MarkDown 連結。

掘金翻譯計劃是一個翻譯優質網際網路技術文章的社群，文章來源為掘金上的英文分享文章。內容覆蓋 Android、iOS、前端、後端、區塊鏈、產品、設計、人工智慧等領域，想要檢視更多優質譯文請持續關注掘金翻譯計劃、官方微博、知乎專欄。

教你使用Keras on Google Colab（免費GPU）微調深度神經網路
2018-10-23
KerasGoGPU神經網路
Google Colab的使用
2024-11-28
Go
在 Google Colab 中使用 JuiceFS
2024-03-22
GoUI
Google Colab 現已支援直接使用 ? transformers 庫
2023-12-01
GoORM
Colab教程（超級詳細版）及Colab Pro/Colab Pro+使用評測
2022-06-12
想免費用谷歌資源訓練神經網路？Colab 詳細使用教程 —— Jinkey 原創
2019-03-04
谷歌神經網路
ZoteroGPT免費使用GPT教程
2024-10-24
GPT
【免費】代替使用VPN訪問google的方法
2018-09-02
Go
Android教程如何免費使用SMSSDK
2018-12-28
Android
Google 免費 AI課程
2024-08-24
GoAI
Bert-vits2最終版Bert-vits2-2.3雲端訓練和推理(Colab免費GPU算力平臺)
2023-12-27
GPU
Colab提供了免費TPU，機器之心幫你試了試
2018-10-11
【教程】使用gitee搭建免費的圖床
2019-05-04
Gitee圖床
Xshell安裝（免費可用）和使用教程
2024-06-01
在 Google Colab 中快速實踐深度學習
2019-06-17
Go深度學習
Haiper：免費AI影片工具，媲美Sora （附使用教程）
2024-04-09
AISora
2024年最新版Typora免費使用教程心得
2024-08-28
免下載就能用的主圖模板，免費分享模板使用教程！
2023-04-12
iOS教程免費使用SMSSDK語音驗證的方法
2018-07-25
iOS
使用Hexo&GitHub免費快速搭建部落格教程
2018-03-05
HexoGithub
各平臺免費翻譯API
2019-01-22
API
Kubernetes 教程：在 Containerd 容器中使用 GPU
2020-12-08
AIGPU
阿里雲伺服器使用視訊教程免費下載
2018-10-14
阿里伺服器
深度學習，機器學習神器，白嫖免費GPU
2021-11-22
深度學習機器學習GPU
谷歌地球專業版 Google Earth Pro for Mac免費更新
2020-11-26
谷歌GoMac
Weblogic 視訊教程免費下載
2018-10-19
Web
Quartz 視訊教程免費下載
2018-10-12
quartz
Spark視訊教程免費下載
2018-10-11
Spark
Project免費視訊教程來了
2018-10-09
Project
ElasticSearch 視訊教程免費下載
2018-10-04
Elasticsearch
Wolfram Mathematica 12.3免費安裝教程
2021-11-03
免費試用谷歌的翻譯介面
2019-05-12
谷歌
可免費使用的免費API分享
2023-10-27
API
用免費GPU部署自己的stable-diffusion-學習筆記
2024-03-14
GPU筆記
使用google翻譯 api 翻譯中文成其他語言
2018-08-06
GoAPI
PicTech AI免費線上圖片翻譯工具及使用說明收藏
2024-08-10
AI
PC端免費高效的同聲翻譯
2022-04-02
【譯】A GPU Approach to Particle Physics
2022-02-14
GPUAPP