比特幣指令碼語言

tualala發表於2018-12-10

指令碼是一種簡單的指令碼語言,也是比特幣交易處理的核心。如果你曾經寫過彙編程式碼,你會發現這篇文章很容易理解,而且可能是有趣的;否則它可能是特別具挑戰性的。所以請保持專注!

遇上機器碼

指令碼是計算機程式,作為程式設計師,你當然知道程式是什麼。程式接受輸入,執行一段時間,然後返回輸出。程式語言是我們編寫計算機能理解的程式的工具,因為大多數語言都帶有編譯器,可以將人性化的程式碼對映到CPU來操作,所以也稱為操作碼。

操作碼

操作碼包括記憶體操作,數學,迴圈,函式呼叫以及在程式程式語言(如C)中找到的所有內容。它們構成CPU的口語,即所謂的機器碼。由於位元組是計算機的首選習慣用法,因此操作碼也是位元組。結果就是,機器碼錶示要在CPU上執行的操作的位元組串。

在像C這樣的高階程式語言中考慮這段程式碼:

x = 0x23;
x += 0x4b;
x *= 0x1e;

現在假設你要在假設的小尾數的CPU上編譯和執行此程式碼,該CPU具有16位記憶體(暫存器)的單個單元和以下操作碼集:

opcode encoding V
SET(V) ab V 16-bit
ADD(V) ac V 16-bit
MUL(V) ad V 16-bit

操作碼解釋如下:

  • SET使用值V載入暫存器。
  • ADD將V新增到暫存器中。
  • MUL將暫存器乘以V。

這種CPU的編譯器將生成這9個位元組的機器程式碼:

ab 23 00 ac 4b 00 ad 1e 00

以下是它的解釋方式:

  • 1.使用值23載入暫存器。
  • 2.將4b新增到暫存器,現在是23 + 4b = 6e。
  • 3.將暫存器乘以1e,得到6e * 1e = ce4。

暫存器儲存最終結果,即ce4。

堆疊記憶體

大多數情況下,我們需要使用變數跟蹤複雜的程式狀態。在C中,根據變數是靜態分配還是使用malloc分配,它儲存在不同排列的記憶體中。雖然malloc-ed資料像一個非常大的陣列中的元素一樣被訪問,但靜態變數被推送到一堆名為stack的專案中並從中彈出。堆疊以LIFO方式執行(後進先出),這意味著你推送的最後一個專案將是第一個彈出的專案。

考慮這個虛擬函式:

int foo() {

    /* 1 */

    /* 2 */
    uint8_t a = 0x12;
    uint16_t b = 0xa4;
    uint32_t c = 0x2a5e7;

    /* 3 */
    uint32_t d = a + b + c;

    return d;

    /* 4 */
}

堆疊最初是空的(1):

[]

然後,推送三個變數(2):

[12]
[12, a4 00]
[12, a4 00, e7 a5 02 00]

第四個變數被賦予其他變數的總和並被推入堆疊(3):

[12, a4 00, e7 a5 02 00, 9d a6 02 00]

堆疊的尖端是返回值,並通過其他方式傳送回函式呼叫者。每個臨時堆疊變數都會在塊(4)的末尾彈出,因為必須平衡推push/彈pop操作,以便堆疊始終返回其初始狀態:

[12, a4 00, e7 a5 02 00]
[12, a4 00]
[12]
[]

指令碼機器碼

同樣,比特幣核心有自己的“虛擬處理器”來解釋指令碼機器碼。指令碼具有豐富的操作碼,但與英特爾等完全成熟的CPU相比卻非常有限。關於指令碼的一些關鍵事實:

  • 1.指令碼不迴圈。
  • 2.指令碼總是終止。
  • 3.指令碼記憶體訪問是基於堆疊的。

實際上,第1點也意味著第2點。第3點意味著在Script中沒有像命名變數這樣的東西,你只需在堆疊上進行計算。通常,你推送的堆疊項成為後續操作碼的運算元。在指令碼的末尾,頂部堆疊項是返回值。

在介紹現實世界的指令碼之前,讓我們先列舉一些操作碼。如需全套,請檢視位元官方維基頁面

常量

以下操作碼將數字0-16推入堆疊:

opcode encoding
OP_0 00
OP_1-OP_16 51-60

按照慣例,OP_0OP_1也表示布林值OP_FALSE(零)和OP_TRUE(非零)。

例:

54 57 00 60

或者:

OP_4 OP_7 OP_0 OP_16

這是堆疊如何發展:

[]
[4]
[4, 7]
[4, 7, 0]
[4, 7, 0, 16]

返回值是最高項,因此指令碼返回16。我知道,這是毫無意義的,但這是一個開始。

推送資料

提供了幾個操作碼來推送自定義資料。它們的運算元大小不同:

opcode encoding L (length) D (data)
OP_PUSHDATA1 4c L D 8-bit L bytes
OP_PUSHDATA2 4d L D 16-bit L bytes
OP_PUSHDATA4 4e L D 32-bit L bytes

例如,如果你的資料長度可以儲存為8位數字,那麼OP_PUSHDATA1是你的最佳選擇。看這個:

4c 14 11 06 03 55 04 8a
0c 70 3e 63 2e 31 26 30
24 06 6c 95 20 30

第一個位元組顯然是OP_PUSHDATA1操作碼,後面是1位元組長度14,即十進位制20.因此,接下來會有20個位元組的資料。這條指令的作用是將這些資料壓入堆疊:

[11 06 03 55 04 8a 0c 70
 3e 63 2e 31 26 30 24 06
 6c 95 20 30]

實際上,與varints一樣,對於非常短的資料有一種特殊的編碼。如果操作碼位於01和4b(包括)之間,則它是一個推送資料操作,其中操作碼本身是以位元組為單位的長度:

opcode encoding L (length) D (data)
L L D 01-4b L bytes

例如,在字串中:

07 8f 49 b2 e2 ec 7c 44

操作碼07意味著要推送7個位元組的資料:

[8f 49 b2 e2 ec 7c 44]

區塊鏈中的下一個塊呢?

你學到了一些關於機器程式碼和操作碼的知識。指令碼是礦工軟體理解的簡單低階語言。使用堆疊記憶體跟蹤指令碼狀態。

在下一篇文章中,我將向你展示操作程式碼,它不僅僅是推送資料。 如果你喜歡它,請分享這篇文章!

======================================================================

分享一些以太坊、EOS、比特幣等區塊鏈相關的互動式線上程式設計實戰教程:

  • java以太坊開發教程,主要是針對java和android程式設計師進行區塊鏈以太坊開發的web3j詳解。
  • python以太坊,主要是針對python工程師使用web3.py進行區塊鏈以太坊開發的詳解。
  • php以太坊,主要是介紹使用php進行智慧合約開發互動,進行賬號建立、交易、轉賬、代幣開發以及過濾器和交易等內容。
  • 以太坊入門教程,主要介紹智慧合約與dapp應用開發,適合入門。
  • 以太坊開發進階教程,主要是介紹使用node.js、mongodb、區塊鏈、ipfs實現去中心化電商DApp實戰,適合進階。
  • C#以太坊,主要講解如何使用C#開發基於.Net的以太坊應用,包括賬戶管理、狀態與交易、智慧合約開發與互動、過濾器和交易等。
  • EOS教程,本課程幫助你快速入門EOS區塊鏈去中心化應用的開發,內容涵蓋EOS工具鏈、賬戶與錢包、發行代幣、智慧合約開發與部署、使用程式碼與智慧合約互動等核心知識點,最後綜合運用各知識點完成一個便籤DApp的開發。
  • java比特幣開發教程,本課程面向初學者,內容即涵蓋比特幣的核心概念,例如區塊鏈儲存、去中心化共識機制、金鑰與指令碼、交易與UTXO等,同時也詳細講解如何在Java程式碼中整合比特幣支援功能,例如建立地址、管理錢包、構造裸交易等,是Java工程師不可多得的比特幣開發學習課程。
  • php比特幣開發教程,本課程面向初學者,內容即涵蓋比特幣的核心概念,例如區塊鏈儲存、去中心化共識機制、金鑰與指令碼、交易與UTXO等,同時也詳細講解如何在Php程式碼中整合比特幣支援功能,例如建立地址、管理錢包、構造裸交易等,是Php工程師不可多得的比特幣開發學習課程。
  • tendermint區塊鏈開發詳解,本課程適合希望使用tendermint進行區塊鏈開發的工程師,課程內容即包括tendermint應用開發模型中的核心概念,例如ABCI介面、默克爾樹、多版本狀態庫等,也包括代幣發行等豐富的實操程式碼,是go語言工程師快速入門區塊鏈開發的最佳選擇。

匯智網原創翻譯,轉載請標明出處。這裡是原文比特幣指令碼語言

相關文章