pytorch dataloader和batch_size大小的理解

YoJayC發表於2020-10-28

原文網址 : https://blog.csdn.net/YoJayC/article/details/109340277

pytorch中dataloader的大小將根據batch_size的大小自動調整。如果訓練資料集有1000個樣本，並且batch_size的大小為10，則dataloader的長度就是100。

需要注意的是，如果dataset的大小並不能被batch_size整除，則dataloader中最後一個batch可能比實際的batch_size要小。例如，對於1001個樣本，batch_size的大小是10，train_loader的長度len(train_loader)=101，最後一個batch將僅含一個樣本。可以通過設定dataloader的drop_last屬性為True來避免這種情況。

Pytorch的Dataset提供了得到dataset中單個樣本的介面，即通過使用index下標來獲得單個樣本資料。Dataloader用來提供batch個樣本供模型訓練

class MyDataset(Dataset):
    def __init__(self, size):
        self.x = torch.randn(size, 1)
    
    def __getitem__(self, index):
        return self.x[index]

    def __len__(self):
        return len(self.x)

dataset = MyDataset(1001)

data_loader = DataLoader(dataset,
                         batch_size=10)

len(data_loader)

for batch_idx, data in enumerate(data_loader):
    print 'batch idx{}, batch len {}'.format(
        batch_idx, len(data))

data_loader = DataLoader(dataset,
                     batch_size=10,
                     drop_last=True)

len(data_loader)

for batch_idx, data in enumerate(data_loader):
    print 'batch idx{}, batch len {}'.format(
        batch_idx, len(data))

參考：https://discuss.pytorch.org/t/about-the-relation-between-batch-size-and-length-of-data-loader/10510/4

Pytorch - Dataloader
2024-04-01
PyTorch
Pytorch入門-dataloader
2024-03-14
PyTorch
【小白學PyTorch】3 淺談Dataset和Dataloader
2020-09-01
PyTorch
Pytorch建模過程中的DataLoader與Dataset
2023-01-04
PyTorch
Pytorch入門上 —— Dataset、Tensorboard、Transforms、Dataloader
2021-12-15
PyTorchORBORM
Dataset和Dataloader的使用
2023-01-05
[原始碼解析] PyTorch 分散式(2) --- 資料載入之DataLoader
2021-08-18
原始碼PyTorch分散式
pytorch中forward的理解
2024-05-21
PyTorchForward
pytorch dataloader num_workers引數設定導致訓練阻塞
2020-10-02
PyTorch
Torch 中Dataset 和Dataloader 的資料變換
2024-08-25
pytorch resnet50 模型轉成 onnx 的程式碼樣例，batch_size 是動態可調節的
2023-04-03
PyTorch模型BAT
直播小程式原始碼，pytorch同時讓兩個dataloader打亂的順序是相同
2023-10-10
原始碼PyTorch
記憶體大小與效能的理解
2024-06-06
記憶體
pytorch中nn.Embedding理解
2020-11-28
PyTorch
PYTORCH中的學習率怎麼理解
2024-10-23
PyTorch
Pytorch中stack()方法的總結及理解
2021-11-08
PyTorch
用 Pytorch 理解卷積網路
2020-04-06
PyTorch卷積
01_pytorch和tensorflow的區別
2021-04-13
PyTorch
深度學習入門筆記——DataLoader的使用
2024-10-29
深度學習筆記
小白學PyTorch 動態圖與靜態圖的淺顯理解
2020-08-23
PyTorch
PyTorch和TensorFlow比較 - thegradient
2019-10-11
PyTorch
修改SVG圖片的大小和顏色
2020-05-10
SVG
瀏覽器的視窗位置和大小
2019-05-07
瀏覽器
Pytorch的模型加速方法：Dataparallel (DP) 和 DataparallelDistributedparallel (DDP)
2021-07-16
PyTorch模型Parallel
理解pytorch幾個高階選擇函式（如gather）
2020-09-30
PyTorch函式
NSProxy的理解和使用
2018-05-16
Exception和Error的理解
2018-07-26
ExceptionError
DPC和ISR的理解
2018-09-04
promise的理解和使用
2020-05-18
Promise
Future和CompletableFuture的理解
2024-10-23
@bean和@component的理解
2018-04-01
Bean
SPU和SKU的理解
2020-11-28
字串大小寫轉換和字串的比較
2021-08-11
字串
如何獲取 PostgreSQL 資料庫中的表大小、資料庫大小、索引大小、模式大小、表空間大小、列大小
2024-07-27
SQL資料庫索引模式
redis api的使用和理解
2018-11-08
RedisAPI
對AIDL和Binder的理解
2020-10-13
AI
對session和cookie的理解
2020-10-27
SessionCookie
Flink Time和Watermark的理解
2019-02-14

pytorch dataloader和batch_size大小的理解

相關文章