使用libtorch訓練一個異或邏輯閘

兜尼完發表於2024-03-13

原文網址 : https://www.cnblogs.com/mengxiangdu/p/18023716

本文以一個例子介紹如何使用libtorch建立一個包含多層神經元的感知機，訓練識別異或邏輯。即${ z = x \text{^} y }$。本例的測試環境是VS2017和libtorch1.13.1。從本例可以學到如何複用網路結構，如下方的LinearSigImpl類的寫法。該測試網路結構如下圖。一個線性層2輸入3輸出，一個Sigmoid啟用函式3輸入3輸出，一個線性輸出層：

標頭檔案程式碼如下：

class LinearSigImpl : public torch::nn::Module
{
public:
    LinearSigImpl(int intput_features, int output_features);
    torch::Tensor forward(torch::Tensor x);

private:
    torch::nn::Linear ln;
    torch::nn::Sigmoid bn;
};

TORCH_MODULE(LinearSig);

class Mlp : public torch::nn::Module
{
public:
    Mlp(int in_features, int out_features);
    torch::Tensor forward(torch::Tensor x);

private:
    LinearSig ln1;
    torch::nn::Linear output;
};

CPP檔案：

LinearSigImpl::LinearSigImpl(int in_features, int out_features) : 
    ln(nullptr), bn(nullptr)
{
    ln = register_module("ln", torch::nn::Linear(in_features, out_features));
    bn = register_module("bn", torch::nn::Sigmoid());
}

torch::Tensor LinearSigImpl::forward(torch::Tensor x)
{
    x = ln->forward(x);
    x = bn->forward(x);
    return x;
}

Mlp::Mlp(int in_features, int out_features) : 
    ln1(nullptr), output(nullptr)
{
    ln1 = register_module("ln1", LinearSig(in_features, 3));
    output = register_module("output", torch::nn::Linear(3, out_features));
}

torch::Tensor Mlp::forward(torch::Tensor x)
{
    x = ln1->forward(x);
    x = output->forward(x);
    return x;
}

int main()
{
    Mlp linear(2, 1);

    /* 30個樣本。在這裡是一行一個樣本 */
    at::Tensor b = torch::rand({ 30, 2 });
    at::Tensor c = torch::zeros({ 30, 1 });
    for (int i = 0; i < 30; i++)
    {
        b[i][0] = (b[i][0] >= 0.5f);
        b[i][1] = (b[i][1] >= 0.5f);
        c[i] = b[i][0].item().toBool() ^ b[i][1].item().toBool();
    }

    //cout << b << endl;
    //cout << c << endl;

    /* 訓練過程 */
    torch::optim::SGD optim(linear.parameters(), torch::optim::SGDOptions(0.01));
    torch::nn::MSELoss lossFunc;
    linear.train();
    for (int i = 0; i < 50000; i++)
    {
        torch::Tensor predict = linear.forward(b);
        torch::Tensor loss = lossFunc(predict, c);
        optim.zero_grad();
        loss.backward();
        optim.step();
        if (i % 2000 == 0)
        {
            /* 每2000次迴圈輸出一次損失函式值 */
            cout << "LOOP:" << i << ",LOSS=" << loss.item() << endl;
        }
    }
    /* 非線性的網路就不輸出網路引數了 */
    /* 太過玄學，輸出也看不懂 */

    /* 做個測試 */
    at::Tensor x = torch::tensor({ { 1.0f, 0.0f }, { 0.0f, 1.0f }, { 1.0f, 1.0f }, { 0.0f, 0.0f} });
    at::Tensor y = linear.forward(x);
    cout << "輸出為[1100]=" << y;

    /* 看看能不能泛化 */
    x = torch::tensor({ { 0.9f, 0.1f }, { 0.01f, 0.2f } });
    y = linear.forward(x);
    cout << "輸出為[10]=" << y;

    return 0;
}

控制檯輸出如下。如果把0.5作為01分界線，從輸出上看網路是有一定的泛化能力的。當然每次執行輸出數字都不同，絕大多數泛化結果都正確：

LOOP:0,LOSS=1.56625
LOOP:2000,LOSS=0.222816
LOOP:4000,LOSS=0.220547
LOOP:6000,LOSS=0.218447
LOOP:8000,LOSS=0.215877
LOOP:10000,LOSS=0.212481
LOOP:12000,LOSS=0.207645
LOOP:14000,LOSS=0.199905
LOOP:16000,LOSS=0.187244
LOOP:18000,LOSS=0.168875
LOOP:20000,LOSS=0.145476
LOOP:22000,LOSS=0.118073
LOOP:24000,LOSS=0.087523
LOOP:26000,LOSS=0.0554768
LOOP:28000,LOSS=0.0280211
LOOP:30000,LOSS=0.0109953
LOOP:32000,LOSS=0.00348786
LOOP:34000,LOSS=0.000959343
LOOP:36000,LOSS=0.000243072
LOOP:38000,LOSS=5.89887e-05
LOOP:40000,LOSS=1.40228e-05
LOOP:42000,LOSS=3.3041e-06
LOOP:44000,LOSS=7.82167e-07
LOOP:46000,LOSS=1.85229e-07
LOOP:48000,LOSS=4.43763e-08
輸出為[1100]= 0.9999
 1.0000
 0.0002
 0.0001
[ CPUFloatType{4,1} ]輸出為[10]= 0.9999
 0.4588
[ CPUFloatType{2,1} ]

量子邏輯閘
2019-06-24
機器學習之邏輯迴歸：模型訓練
2020-06-27
機器學習邏輯迴歸模型
類NMOS邏輯閘電路
2020-11-06
JS邏輯練習
2020-11-27
JS
程式設計是最好的邏輯能力訓練方法！ - thoughtbot
2021-05-07
程式設計
JavaScript || 邏輯或運算子
2018-11-01
JavaScript
一分鐘搞懂邏輯運算子&(並且) , |(或者) , !(非) , ^(異或) , &&(短路與) , ||(短路或)之間的關係
2020-11-03
一個登入點兩個邏輯漏洞-edusrc
2022-05-08
[原始碼解析] PyTorch 分散式之彈性訓練(4)---Rendezvous 架構和邏輯
2021-12-27
原始碼PyTorch分散式架構
【LLM訓練】從零訓練一個大模型有哪幾個核心步驟？
2024-11-24
大模型
訓練一個目標檢測模型
2023-12-13
模型
聊聊從邏輯閘到作業系統的計算機
2018-07-02
作業系統計算機
【vjudge訓練記錄】11月個人訓練賽1
2024-11-03
例項後臺執行訓練或任務
2024-05-13
怎麼訓練出一個NB的Prophet模型
2020-07-21
模型
5.1一階謂詞邏輯
2020-05-26
[20180410]為什麼2個邏輯讀不一樣.txt
2018-04-10
DSLogic邏輯分析儀使用筆記
2024-07-19
筆記
【學校訓練記錄】10月個人訓練賽3個人題解
2024-10-17
CO聯產品成本差異分攤計算邏輯
2022-05-16
邏輯式程式語言極簡實現（使用C#） - 2. 一道邏輯題：誰是凶手
2020-06-30
C#
什麼是端到端的訓練或學習？
2020-11-01
「NLP」GPT：第一個引入Transformer的預訓練模型
2019-08-27
GPTORM模型
創新實訓(十）比賽內部邏輯處理
2024-06-23
【預訓練語言模型】使用Transformers庫進行BERT預訓練
2024-03-13
模型ORM
實踐篇：使用Spark和Scala來訓練您的第一個分類器！
2019-03-01
Spark
異或
2024-05-02
關於SVM數學細節邏輯的個人理解（一）
2018-04-11
記錄多專案共用一個公眾號邏輯修改
2023-02-21
邏輯題
2024-08-17
如何使用jMeter傳送兩個邏輯上相關的HTTP請求
2018-05-05
JMeterHTTP
邏輯迴歸為什麼使用sigmod
2019-02-22
邏輯迴歸
webrtc原理及相關api使用邏輯
2018-08-16
WebAPI
Hystrix降級邏輯中如何獲取觸發的異常
2018-07-22
有史以來最快的邏輯閘可以使計算機快一百萬倍
2022-05-13
計算機
創新實訓（七）——比賽（Contest）內部邏輯處理
2024-06-22
借用Ultralytics Yolo快速訓練一個物體檢測器
2024-10-31
YOLO
如何在 Linux 分割槽或邏輯卷中建立檔案系統
2019-04-10
Linux

使用libtorch訓練一個異或邏輯閘

相關文章