四天速成！香港科技大學 PyTorch 課件分享

思源發表於2017-10-09

前天，香港科技大學計算機系教授 Sung Kim 在 Google Drive 分享了一個 3 天速成的 TensorFlow 極簡入門教程；接著，他在 GitHub 上又分享了一個 3 至 4 日的速成教程，教大家如何使用 PyTorch 進行機器學習／深度學習。Sung Kim 共享了該教程的程式碼和 PPT 資源，機器之心對其做了扼要介紹。資源連結請見文中。

程式碼：https://github.com/hunkim/PyTorchZeroToAll
PPT：http://bit.ly/PyTorchZeroAll
百度雲盤：https://pan.baidu.com/s/1cpoyXw

PyTorch 開源於今年一月份，它是使用 GPU 和 CPU 優化的深度學習張量庫，也是一個 Python 工具包，為目前最流行的深度學習框架之一；它具有兩個高階功能：

帶有強大的 GPU 加速的張量計算（類似 NumPy）
構建在基於 tape 的 autograd 系統之上的深度神經網路

因此必要之時你可以再利用 Python 工具包比如 NumPy、SciPy 和 Cython 擴充套件 PyTorch。PyTorch 目前處於早期的 beta 版，還有待進一步完善與更新。通常來講，PyTorch 作為庫主要包含以下元件：

1. Torch：類似於 NumPy 的張量庫，帶有強大的 GPU 支援

2. torch.autograd：一個基於 tape 的自動微分庫，支援 torch 中的所有的微分張量運算

3. torch.nn：一個專為最大靈活性而設計、與 autograd 深度整合的神經網路庫

4. torch.multiprocessing：Python 多運算，但在運算中帶有驚人的 torch 張量記憶體共享。這對資料載入和 Hogwild 訓練很有幫助。

5. torch.utils：資料載入器、訓練器以及其他便利的實用功能

6. torch.legacy(.nn/.optim)：出於後向相容性原因而從 torch 移植而來的舊程式碼

人們使用 PyTorch 一般出於兩個目的：

代替 NumPy 從而可以使用強大的 GPU
PyTorch 作為深度學習研究平臺提供了最大的靈活性與速度

PyTorch 是由若干個資深工程師和研究者共同發起的社群專案，目前主要的維護人員有 Adam Paszke、Sam Gross、Soumith Chintala 和 Gregory Chanan。

PyTorch 課程目錄

概覽
線性模型
梯度下降
反向傳播
PyTorch 線性迴歸
Logistic 迴歸
寬&深
資料載入器
Softmax 分類器
CNN
RNN

下面是整個課程的概述：

線性模型

如下為線性模型的基本思想，我們希望能構建一個線性方程擬合現存的資料點。該線性了方程函式將根據資料點與其距離自動調整權重，權重調整的方法即使用優化演算法最小化真實資料與預測資料的距離。

四天速成！香港科技大學 PyTorch 課件分享

以下為該線性模型的實現程式碼，我們先定義特徵 x 與標註 y，然後將預測值與真實值差的平方作為損失函式。隨後初始化模型權重並開始前向傳播。

import numpy as np
import matplotlib.pyplot as plt
x_data = [1.0, 2.0, 3.0]
y_data = [2.0, 4.0, 6.0]
# our model forward pass
def forward(x):
    return x * w
# Loss function
def loss(x, y):
    y_pred = forward(x)
    return (y_pred - y) * (y_pred - y)
w_list = []
mse_list = []
for w in np.arange(0.0, 4.1, 0.1):
    print("w=", w)
    l_sum = 0
    for x_val, y_val in zip(x_data, y_data):
        y_pred_val = forward(x_val)
        l = loss(x_val, y_val)
        l_sum += l
        print("\t", x_val, y_val, y_pred_val, l)
    print("NSE=", l_sum / 3)
    w_list.append(w)
    mse_list.append(l_sum / 3)
plt.plot(w_list, mse_list)
plt.ylabel('Loss')
plt.xlabel('w')
plt.show()

梯度下降

四天速成！香港科技大學 PyTorch 課件分享

梯度下降在最優化中又稱之為最速下降演算法，以下為該演算法的基本概念。我們可以看到，若我們希望最小化的損失函式為凸函式，那麼損失函式對各個權重的偏導數將指向該特徵的極小值。如下當初始權重處於損失函式遞增部分時，那麼一階梯度即損失函式在該點的斜率，且遞增函式的斜率為正，那麼當前權重減去一個正數將變小，因此權重將沿遞增的反方向移動。同理可得當權重處於遞減函式的情況。

如下我們手動實現了簡單的梯度下降演算法。前面還是先定義模型、損失函式，因為我們已知損失函式的結構，那麼就可以手動對其求導以確定梯度函式的結構。得出了權重梯度的表示式後可以將其代入權重更新的迴圈語句以定義訓練。

x_data = [1.0, 2.0, 3.0]
y_data = [2.0, 4.0, 6.0]

w = 1.0  # any random value


# our model forward pass
def forward(x):
    return x * w


# Loss function
def loss(x, y):
    y_pred = forward(x)
    return (y_pred - y) * (y_pred - y)


# compute gradient
def gradient(x, y):  # d_loss/d_w
    return 2 * x * (x * w - y)

# Before training
print("predict (before training)",  4, forward(4))

# Training loop
for epoch in range(10):
    for x_val, y_val in zip(x_data, y_data):
        grad = gradient(x_val, y_val)
        w = w - 0.01 * grad
        print("\tgrad: ", x_val, y_val, grad)
        l = loss(x_val, y_val)

    print("progress:", epoch, l)

# After training
print("predict (after training)",  4, forward(4))

反向傳播

下圖展示了反向傳播演算法的鏈式求導法則與過程。對於反向傳播來說，給定權重下，我們先要計算前向傳播的結果，然後計算該結果與真實值的距離或誤差。隨後將該誤差沿誤差產生的路徑反向傳播以更新權重，在這個過程中誤差會根據求導的鏈式法則進行分配。

四天速成！香港科技大學 PyTorch 課件分享

以下程式碼實現了反向傳播演算法，我們可以看到在 PyTorch 中反向傳播的語句為「loss(x_val, y_val).backward()」，即將損失函式沿反向傳播。

import torch
from torch import nn
from torch.autograd import Variable


x_data = [1.0, 2.0, 3.0]
y_data = [2.0, 4.0, 6.0]

w = Variable(torch.Tensor([1.0]),  requires_grad=True)  # Any random value

# our model forward pass


def forward(x):
    return x * w

# Loss function


def loss(x, y):
    y_pred = forward(x)
    return (y_pred - y) * (y_pred - y)

# Before training
print("predict (before training)",  4, forward(4).data[0])

# Training loop
for epoch in range(10):
    for x_val, y_val in zip(x_data, y_data):
        l = loss(x_val, y_val)
        l.backward()
        print("\tgrad: ", x_val, y_val, w.grad.data[0])
        w.data = w.data - 0.01 * w.grad.data

        # Manually zero the gradients after updating weights
        w.grad.data.zero_()

    print("progress:", epoch, l.data[0])

# After training
print("predict (after training)",  4, forward(4).data[0])

PyTorch 線性迴歸

定義資料：

import torch
from torch.autograd import Variable

x_data = Variable(torch.Tensor([[1.0], [2.0], [3.0]]))
y_data = Variable(torch.Tensor([[2.0], [4.0], [6.0]]))

定義模型，在 PyTorch 中，我們可以使用高階 API 來定義相關的模型或層級。如下定義了「torch.nn.Linear(1, 1)」，即一個輸入變數和一個輸出變數。

class Model(torch.nn.Module):

    def __init__(self):
        """
        In the constructor we instantiate two nn.Linear module
        """
        super(Model, self).__init__()
        self.linear = torch.nn.Linear(1, 1)  # One in and one out

    def forward(self, x):
        """
        In the forward function we accept a Variable of input data and we must return
        a Variable of output data. We can use Modules defined in the constructor as
        well as arbitrary operators on Variables.
        """
        y_pred = self.linear(x)
        return y_pred

構建損失函式和優化器，構建損失函式也可以直接使用「torch.nn.MSELoss(size_average=False)」呼叫均方根誤差函式。優化器可以使用「torch.optim.SGD()」提到用隨機梯度下降，其中我們需要提供優化的目標和學習率等引數。

# Construct our loss function and an Optimizer. The call to model.parameters()
# in the SGD constructor will contain the learnable parameters of the two
# nn.Linear modules which are members of the model.
criterion = torch.nn.MSELoss(size_average=False)
optimizer = torch.optim.SGD(model.parameters(), lr=0.01)

訓練模型，執行前向傳播計算損失函式，並優化引數：

# Training loop
for epoch in range(500):
        # Forward pass: Compute predicted y by passing x to the model
    y_pred = model(x_data)

    # Compute and print loss
    loss = criterion(y_pred, y_data)
    print(epoch, loss.data[0])

    # Zero gradients, perform a backward pass, and update the weights.
    optimizer.zero_grad()
    loss.backward()
    optimizer.step()

Logistic 迴歸

以下展示了 Logistic 迴歸的基本要素和對應程式碼。Logistic 迴歸的構建由以下三種函式組成：Sigmoid 函式、目標函式以及損失函式。下圖分別給出了三種函式的對應程式碼。其中 Sigmoid 函式將線性模型演變為 Logistic 迴歸模型，而損失函式負責建立標準以測量目標與輸出之間的二值交叉熵。

四天速成！香港科技大學 PyTorch 課件分享

Softmax 分類

以下展示了 Softmax 分類的基本概念，其中最重要的是在最後一層使用了 Softmax 函式。我們可以使用 Softmax 函式將輸出值轉化為和為 1 的類別概率。

四天速成！香港科技大學 PyTorch 課件分享

載入資料集與匯入資料載入器：

# MNIST Dataset
train_dataset = datasets.MNIST(root='./data/',
                               train=True,
                               transform=transforms.ToTensor(),
                               download=True)

test_dataset = datasets.MNIST(root='./data/',
                              train=False,
                              transform=transforms.ToTensor())

# Data Loader (Input Pipeline)
train_loader = torch.utils.data.DataLoader(dataset=train_dataset,
                                           batch_size=batch_size,
                                           shuffle=True)

test_loader = torch.utils.data.DataLoader(dataset=test_dataset,
                                          batch_size=batch_size,
                                          shuffle=False)

定義模型的架構，並選擇優化器。如下我們可以瞭解該 Softmax 分類模型在前面使用了五個全連線層，並在最後一層使用了 Softmax 函式。例如先使用「l1 = nn.Linear(784, 520)」定義全連線的輸入結點數與輸出結點數，784 為 MNIST 的畫素點數，再使用「F.relu(self.l1(x))」定義該全連線的啟用函式為 ReLU。

class Net(nn.Module):

    def __init__(self):
        super(Net, self).__init__()
        self.l1 = nn.Linear(784, 520)
        self.l2 = nn.Linear(520, 320)
        self.l3 = nn.Linear(320, 240)
        self.l4 = nn.Linear(240, 120)
        self.l5 = nn.Linear(120, 10)

    def forward(self, x):
        x = x.view(-1, 784)  # Flatten the data (n, 1, 28, 28)-> (n, 784)
        x = F.relu(self.l1(x))
        x = F.relu(self.l2(x))
        x = F.relu(self.l3(x))
        x = F.relu(self.l4(x))
        x = F.relu(self.l5(x))
        return F.log_softmax(x)

model = Net()

optimizer = optim.SGD(model.parameters(), lr=0.01, momentum=0.5)

CNN

下圖展示了一個簡單的卷積神經網路，它由輸入層、卷積層 1、池化層 1、卷積層 2、池化層 2、全連線層組成。其中卷積層 1、2 是二維的，其輸入通道為 1，輸出通道為 10，卷積核大小為 5。其中池化層採用的是最大池化運算。

四天速成！香港科技大學 PyTorch 課件分享

以下是上圖簡單卷積神經網路的載入資料：

# MNIST Dataset
train_dataset = datasets.MNIST(root='./data/',
                               train=True,
                               transform=transforms.ToTensor(),
                               download=True)

test_dataset = datasets.MNIST(root='./data/',
                              train=False,
                              transform=transforms.ToTensor())

# Data Loader (Input Pipeline)
train_loader = torch.utils.data.DataLoader(dataset=train_dataset,
                                           batch_size=batch_size,
                                           shuffle=True)

test_loader = torch.utils.data.DataLoader(dataset=test_dataset,
                                          batch_size=batch_size,
                                          shuffle=False)

以下程式碼定義了上圖卷積神經網路的架構，並定義了優化器。我們同樣可以使用高階 API 新增摺積層，例如「nn.Conv2d(1, 10, kernel_size=5)」可以新增摺積核為 5 的卷積層。此外，在卷積層與全連線層之間，我們需要壓平張量，這裡使用的是「x.view(in_size, -1)」。

class Net(nn.Module):

    def __init__(self):
        super(Net, self).__init__()
        self.conv1 = nn.Conv2d(1, 10, kernel_size=5)
        self.conv2 = nn.Conv2d(10, 20, kernel_size=5)
        self.mp = nn.MaxPool2d(2)
        self.fc = nn.Linear(320, 10)

    def forward(self, x):
        in_size = x.size(0)
        x = F.relu(self.mp(self.conv1(x)))
        x = F.relu(self.mp(self.conv2(x)))
        x = x.view(in_size, -1)  # flatten the tensor
        x = self.fc(x)
        return F.log_softmax(x)


model = Net()

optimizer = optim.SGD(model.parameters(), lr=0.01, momentum=0.5)

[譯] 密碼學速成課
2019-05-05
密碼學
GitHub 星標 7K 的電腦科學速成課！
2021-05-14
Github
華中科技大學軟體學院機器學習課程實驗
2024-10-22
機器學習
課件
2024-03-13
CCAI 2017 | 香港科技大學計算機系主任楊強：論深度學習的遷移模型
2018-08-23
AI計算機深度學習模型
山東科技大學OJ題庫 1403 它滿足條件嗎？
2020-12-27
運算更快，耗電更少！香港科技大學首創多層全光學人工神經網路
2019-09-18
神經網路
手把手 | 資料科學速成課：給Python新手的實操指南
2018-03-06
資料科學Python
學堂線上影片課件課程下載工具，如何在電腦端下載學堂線上影片課程課件資料PDF,PPT到本地？
2024-11-12
Mooc下載器：中國大學mooc慕課影片課件課程下載工具，如何在電腦端下載中國大學mooc慕課影片課程課件資料到本地？
2024-10-29
超星學習通(學銀線上)影片課件課程下載工具，如何在電腦端下載超星學習通(學銀線上)影片課程課件資料PDF,PPT到本地？
2024-12-05
電子課件
2024-06-21
【部分】Java速成學習筆記
2020-10-02
Java筆記
Pytorch 手寫數字識別深度學習基礎分享
2024-12-09
PyTorch深度學習
江蘇科技大學大二《資料結構》課內實驗報告模板答案
2024-11-16
資料結構
什麼值得讀 ? 計算機基礎知識速成課
2019-03-18
計算機
[譯][A crash course in WebAssembly] Just-in-time(JIT)編譯器速成課
2019-02-27
Web編譯
課件製作工具2
2018-07-18
2018年最新動腦學院java課程分享
2019-01-03
Java
網易雲課堂影片課件課程下載工具，如何在電腦端下載網易雲課堂影片課程課件資料到本地？
2024-11-02
深度學習貝葉斯，這是一份密集的6天速成課程（視訊與PPT）
2019-03-02
深度學習
雲端計算學習素材框架，msyql查詢操作課件
2019-12-19
框架
雲端計算學習素材框架，msyql高階操作課件
2019-12-19
框架
python速成
2024-09-02
Python
香港抽血驗y男女哪些檢測條件必須達成？香港基因檢測中心
2020-12-16
HTML郵件模版分享
2019-11-21
HTML
《PyTorch》Part5 PyTorch之遷移學習
2020-11-21
PyTorch遷移學習
（pytorch-深度學習系列）pytorch資料操作
2020-10-12
PyTorch深度學習
【Pytorch教程】迅速入門Pytorch深度學習框架
2024-08-26
PyTorch深度學習框架
上課作品分享感悟
2024-12-10
橙啦影片課件課程下載工具，如何在電腦端下載橙啦影片課程課件資料PDF,PPT到本地？
2024-11-19
學會這4個PPT技巧，你就能做出漂亮的PPT教學課件
2018-11-26
【Mark Schmidt課件】機器學習與資料探勘——MLE與MAP
2018-11-09
機器學習
雲端計算學習路線教程大綱課件：LVM管理
2019-09-17
LVM
雲端計算學習路線教程大綱課件：FTP Server
2019-10-15
FTPServer
雲端計算學習素材、課件，msyql知識點講解
2019-12-19
香港大學韓鍇課題組招募計算機視覺、深度學習方向博士及博士後
2022-11-25
計算機視覺深度學習
pytorch學習筆記
2020-10-24
PyTorch筆記
PyTorch 學習筆記
2024-10-11
PyTorch筆記

四天速成！香港科技大學 PyTorch 課件分享

PyTorch 課程目錄

線性模型

梯度下降

反向傳播

PyTorch 線性迴歸

Logistic 迴歸

Softmax 分類

CNN

相關文章