李沐動手學深度學習V2-chap_preliminaries

猫猫不会吃芋头發表於2024-07-02

原文網址 : https://www.cnblogs.com/Mmbhcyt/p/18267941

深度學習

李沐動手學深度學習V2

文章內容說明

本文主要是自己學習過程中的隨手筆記，需要自取
課程參考B站：https://space.bilibili.com/1567748478?spm_id_from=333.788.0.0
課件等資訊原影片簡介中有

CSV檔案修改讀取成張量tensor

資料預處理

首先(建立一個人工資料集，並儲存在CSV（逗號分隔值）檔案) ../data/house_tiny.csv中，在csv檔案中寫入資料

import os

os.makedirs(os.path.join('..', 'data'), exist_ok=True)
data_file = os.path.join('..', 'data', 'house_tiny.csv')
with open(data_file, 'w') as f:
    f.write('NumRooms,Alley,Price\n')  # 列名
    f.write('NA,Pave,127500\n')  # 每行表示一個資料樣本
    f.write('2,NA,106000\n')
    f.write('4,NA,178100\n')
    f.write('NA,NA,140000\n')

要進行讀取資料集，我們匯入pandas包並呼叫read_csv函式。該資料集有四行三列。其中每行描述了房間數量（“NumRooms”）、巷子型別（“Alley”）和房屋價格（“Price”）。

# 如果沒有安裝pandas，只需取消對以下行的註釋來安裝pandas
# !pip install pandas
import pandas as pd

data = pd.read_csv(data_file)
print(data)

結果如下

處理缺失值

為了處理缺失的資料，典型的方法包括插值法和刪除法，下面以插值法作為示例
透過位置索引iloc，我們將data分成inputs和outputs，其中前者為data的前兩列，而後者為data的最後一列。對於inputs中缺少的數值，我們用同一列的均值替換“NaN”項。【第二列求不出均值所以不改變】

inputs, outputs = data.iloc[:, 0:2], data.iloc[:, 2]
inputs = inputs.fillna(inputs.mean())
print(inputs)

結果如下

對於inputs中的類別值或離散值，我們將“NaN”視為一個類別，使用獨熱編碼，NAN值賦0，其他賦1

inputs = pd.get_dummies(inputs, dummy_na=True)
print(inputs)

結果如下

轉為張量格式

現在inputs和outputs中的所有條目都是數值型別，它們可以轉換為張量格式。

import torch

X = torch.tensor(inputs.to_numpy(dtype=float))
y = torch.tensor(outputs.to_numpy(dtype=float))
X, y

結果如下

python預設型別float64，這樣比較慢，機器學習一般改float32

範數

向量的範數是表示一個向量有多大。這裡考慮的大小（size）概念不涉及維度，而是分量的大小。

L1範數

L1範數，它表示為向量元素的絕對值之和

    # 向量(1維張量)
    vector = torch.tensor([1.0, 2.0, 3.0, 4.0, -5.0])
    # 求向量的L1範數
    norm1 = torch.norm(vector, p=1, dim=0)

結果如下

L2範數

L2範數是向量元素平方和的平方根

可以用以下程式碼實現

u = torch.tensor([3.0, -4.0]) #或u = torch.tensor([3.0, -4.0]，p=2)
torch.norm(u)

結果如下

Frobenius範數

Frobenius範數（Frobenius norm）是矩陣元素平方和的平方根

#Frobenius範數是矩陣，Lp範數是向量
torch.norm(torch.ones((4, 9)))

結果如下

自動求導實現

在我們計算y關於x的梯度之前，需要一個地方來儲存梯度。使用如下程式碼

x.requires_grad_(True)  # 等價於x=torch.arange(4.0,requires_grad=True)
x.grad  # 預設值是None

現在計算y

y = 2 * torch.dot(x, x)
y

結果如下

透過呼叫反向傳播函式來自動計算y關於x每個分量的梯度

y.backward()
x.grad

結果如下，儲存x每個分量的梯度（即切線/導數）

驗證一下是否正確

矩陣的反向傳播

分離計算

將某些計算移動到記錄的計算圖之外，使用y.detach()將u賦為標量，及x*x

x.grad.zero_()
y = x * x
u = y.detach()
z = u * x
z.sum().backward()
x.grad == u

結果如下

由於記錄了y的計算結果，我們可以隨後在y上呼叫反向傳播，得到y=xx關於的x的導數，即2x

x.grad.zero_()
y.sum().backward()
x.grad == 2 * x

結果如下

Python控制流的梯度計算

即使構建函式的計算圖需要透過Python控制流（例如，條件、迴圈或任意函式呼叫），我們仍然可以計算得到的變數的梯度
while迴圈的迭代次數和if語句的結果都取決於輸入a的值

def f(a):
    b = a * 2
    while b.norm() < 1000:
        b = b * 2
    if b.sum() > 0:
        c = b
    else:
        c = 100 * b
    return c

a = torch.randn(size=(), requires_grad=True)
d = f(a)
d.backward()

a.grad == d / a

結果如下

李沐動手學習深度學習錨框部分程式碼解析
2024-04-21
深度學習
李沐大佬-動手學深度學習筆記-注意力機制
2024-11-19
深度學習筆記
李沐等人開源中文書《動手學深度學習》預覽版上線
2018-11-29
深度學習
李沐《動手學深度學習》PyTorch 實現版開源，瞬間登上 GitHub 熱榜！
2019-10-08
深度學習PyTorchGithub
重磅|繼吳恩達後，亞馬遜AI主任科學家李沐上線“動手學深度學習”中文課程，全部免費！
2019-02-28
吳恩達亞馬遜AI深度學習
《動手學深度學習》TF2.0 實現
2019-12-11
深度學習TF2
李巨集毅深度學習筆記(四)
2020-12-10
深度學習筆記
【筆記】動手學深度學習-預備知識
2024-04-25
筆記深度學習
《動手學深度學習》TensorFlow2.0版本
2020-03-22
深度學習
Windows10動手深度學習mxnetGPU配置
2018-05-20
Windows深度學習GPU
動手學深度學習需要這些數學基礎知識
2019-07-24
深度學習
李巨集毅深度學習筆記（七）Auto-encoder
2021-01-01
深度學習筆記
【動手學深度學習】2.4 ~ 2.7 節學習（微積分、自動求導、機率、查閱文件）
2023-04-03
深度學習求導
深度學習+深度強化學習+遷移學習【研修】
2021-03-25
深度學習強化學習遷移學習
深度學習學習框架
2018-08-02
深度學習框架
【機器學習】李宏毅——淺談機器學習原理+魚與熊掌兼得的深度學習簡述
2022-12-15
機器學習深度學習
AI+X 經典共讀-《動手學深度學習（Pytorch版）》Task打卡
2024-04-22
AI深度學習PyTorch
深度學習及深度強化學習研修
2021-01-04
深度學習強化學習
深度學習高頻手撕程式碼
2024-06-05
深度學習
深度學習——學習目錄——學習中……
2019-02-19
深度學習
Python學習手冊（入門&爬蟲&資料分析&機器學習&深度學習）
2021-12-20
Python爬蟲機器學習深度學習
####深度學習
2024-03-16
深度學習
深度學習
2024-03-10
深度學習
深度學習
2024-03-21
李巨集毅機器學習-學習筆記
2018-11-13
機器學習筆記
深度學習及深度強化學習應用
2021-01-04
深度學習強化學習
機器學習&深度學習之路
2018-06-07
機器學習深度學習
深度學習學習7步驟
2020-04-06
深度學習
《Python機器學習手冊：從資料預處理到深度學習》
2019-12-17
Python機器學習深度學習
讀懂深度學習，走進“深度學習+”階段
2023-01-13
深度學習
深度學習模型
2018-12-07
深度學習模型
Python深度學習
2019-12-17
Python深度學習
深度學習引言
2024-11-06
深度學習
MySQL深度學習
2021-09-09
MySql深度學習
深度學習-LSTM
2023-02-23
深度學習
深度學習《CycleGAN》
2020-12-04
深度學習
深度學習《StarGAN》
2020-12-05
深度學習
深度學習《patchGAN》
2020-12-05
深度學習

李沐動手學深度學習V2-chap_preliminaries

李沐動手學深度學習V2

文章內容說明

CSV檔案修改讀取成張量tensor

資料預處理

處理缺失值

轉為張量格式

範數

L1範數

L2範數

Frobenius範數

自動求導實現

矩陣的反向傳播

分離計算

Python控制流的梯度計算

相關文章