指令碼是一種簡單的指令碼語言,也是比特幣交易處理的核心。如果你曾經寫過彙編程式碼,你會發現這篇文章很容易理解,而且可能是有趣的;否則它可能是特別具挑戰性的。所以請保持專注!
遇上機器碼
指令碼是計算機程式,作為程式設計師,你當然知道程式是什麼。程式接受輸入,執行一段時間,然後返回輸出。程式語言是我們編寫計算機能理解的程式的工具,因為大多數語言都帶有編譯器,可以將人性化的程式碼對映到CPU來操作,所以也稱為操作碼。
操作碼
操作碼包括記憶體操作,數學,迴圈,函式呼叫以及在程式程式語言(如C)中找到的所有內容。它們構成CPU的口語,即所謂的機器碼。由於位元組是計算機的首選習慣用法,因此操作碼也是位元組。結果就是,機器碼錶示要在CPU上執行的操作的位元組串。
在像C這樣的高階程式語言中考慮這段程式碼:
x = 0x23;
x += 0x4b;
x *= 0x1e;
現在假設你要在假設的小尾數的CPU上編譯和執行此程式碼,該CPU具有16位記憶體(暫存器)的單個單元和以下操作碼集:
opcode | encoding | V |
---|---|---|
SET(V) | ab V | 16-bit |
ADD(V) | ac V | 16-bit |
MUL(V) | ad V | 16-bit |
操作碼解釋如下:
- SET使用值V載入暫存器。
- ADD將V新增到暫存器中。
- MUL將暫存器乘以V。
這種CPU的編譯器將生成這9個位元組的機器程式碼:
ab 23 00 ac 4b 00 ad 1e 00
以下是它的解釋方式:
- 1.使用值23載入暫存器。
- 2.將4b新增到暫存器,現在是23 + 4b = 6e。
- 3.將暫存器乘以1e,得到6e * 1e = ce4。
暫存器儲存最終結果,即ce4。
堆疊記憶體
大多數情況下,我們需要使用變數跟蹤複雜的程式狀態。在C中,根據變數是靜態分配還是使用malloc分配,它儲存在不同排列的記憶體中。雖然malloc-ed資料像一個非常大的陣列中的元素一樣被訪問,但靜態變數被推送到一堆名為stack的專案中並從中彈出。堆疊以LIFO方式執行(後進先出),這意味著你推送的最後一個專案將是第一個彈出的專案。
考慮這個虛擬函式:
int foo() {
/* 1 */
/* 2 */
uint8_t a = 0x12;
uint16_t b = 0xa4;
uint32_t c = 0x2a5e7;
/* 3 */
uint32_t d = a + b + c;
return d;
/* 4 */
}
堆疊最初是空的(1):
[]
然後,推送三個變數(2):
[12]
[12, a4 00]
[12, a4 00, e7 a5 02 00]
第四個變數被賦予其他變數的總和並被推入堆疊(3):
[12, a4 00, e7 a5 02 00, 9d a6 02 00]
堆疊的尖端是返回值,並通過其他方式傳送回函式呼叫者。每個臨時堆疊變數都會在塊(4)的末尾彈出,因為必須平衡推push/彈pop操作,以便堆疊始終返回其初始狀態:
[12, a4 00, e7 a5 02 00]
[12, a4 00]
[12]
[]
指令碼機器碼
同樣,比特幣核心有自己的“虛擬處理器”來解釋指令碼機器碼。指令碼具有豐富的操作碼,但與英特爾等完全成熟的CPU相比卻非常有限。關於指令碼的一些關鍵事實:
- 1.指令碼不迴圈。
- 2.指令碼總是終止。
- 3.指令碼記憶體訪問是基於堆疊的。
實際上,第1點也意味著第2點。第3點意味著在Script中沒有像命名變數這樣的東西,你只需在堆疊上進行計算。通常,你推送的堆疊項成為後續操作碼的運算元。在指令碼的末尾,頂部堆疊項是返回值。
在介紹現實世界的指令碼之前,讓我們先列舉一些操作碼。如需全套,請檢視位元官方維基頁面。
常量
以下操作碼將數字0-16推入堆疊:
opcode | encoding |
---|---|
OP_0 | 00 |
OP_1-OP_16 | 51-60 |
按照慣例,OP_0
和OP_1
也表示布林值OP_FALSE
(零)和OP_TRUE
(非零)。
例:
54 57 00 60
或者:
OP_4 OP_7 OP_0 OP_16
這是堆疊如何發展:
[]
[4]
[4, 7]
[4, 7, 0]
[4, 7, 0, 16]
返回值是最高項,因此指令碼返回16。我知道,這是毫無意義的,但這是一個開始。
推送資料
提供了幾個操作碼來推送自定義資料。它們的運算元大小不同:
opcode | encoding | L (length) | D (data) |
---|---|---|---|
OP_PUSHDATA1 | 4c L D | 8-bit | L bytes |
OP_PUSHDATA2 | 4d L D | 16-bit | L bytes |
OP_PUSHDATA4 | 4e L D | 32-bit | L bytes |
例如,如果你的資料長度可以儲存為8位數字,那麼OP_PUSHDATA1
是你的最佳選擇。看這個:
4c 14 11 06 03 55 04 8a
0c 70 3e 63 2e 31 26 30
24 06 6c 95 20 30
第一個位元組顯然是OP_PUSHDATA1
操作碼,後面是1位元組長度14,即十進位制20.因此,接下來會有20個位元組的資料。這條指令的作用是將這些資料壓入堆疊:
[11 06 03 55 04 8a 0c 70
3e 63 2e 31 26 30 24 06
6c 95 20 30]
實際上,與varints一樣,對於非常短的資料有一種特殊的編碼。如果操作碼位於01和4b(包括)之間,則它是一個推送資料操作,其中操作碼本身是以位元組為單位的長度:
opcode | encoding | L (length) | D (data) |
---|---|---|---|
L | L D | 01-4b | L bytes |
例如,在字串中:
07 8f 49 b2 e2 ec 7c 44
操作碼07意味著要推送7個位元組的資料:
[8f 49 b2 e2 ec 7c 44]
區塊鏈中的下一個塊呢?
你學到了一些關於機器程式碼和操作碼的知識。指令碼是礦工軟體理解的簡單低階語言。使用堆疊記憶體跟蹤指令碼狀態。
在下一篇文章中,我將向你展示操作程式碼,它不僅僅是推送資料。 如果你喜歡它,請分享這篇文章!
======================================================================
分享一些以太坊、EOS、比特幣等區塊鏈相關的互動式線上程式設計實戰教程:
- java以太坊開發教程,主要是針對java和android程式設計師進行區塊鏈以太坊開發的web3j詳解。
- python以太坊,主要是針對python工程師使用web3.py進行區塊鏈以太坊開發的詳解。
- php以太坊,主要是介紹使用php進行智慧合約開發互動,進行賬號建立、交易、轉賬、代幣開發以及過濾器和交易等內容。
- 以太坊入門教程,主要介紹智慧合約與dapp應用開發,適合入門。
- 以太坊開發進階教程,主要是介紹使用node.js、mongodb、區塊鏈、ipfs實現去中心化電商DApp實戰,適合進階。
- C#以太坊,主要講解如何使用C#開發基於.Net的以太坊應用,包括賬戶管理、狀態與交易、智慧合約開發與互動、過濾器和交易等。
- EOS教程,本課程幫助你快速入門EOS區塊鏈去中心化應用的開發,內容涵蓋EOS工具鏈、賬戶與錢包、發行代幣、智慧合約開發與部署、使用程式碼與智慧合約互動等核心知識點,最後綜合運用各知識點完成一個便籤DApp的開發。
- java比特幣開發教程,本課程面向初學者,內容即涵蓋比特幣的核心概念,例如區塊鏈儲存、去中心化共識機制、金鑰與指令碼、交易與UTXO等,同時也詳細講解如何在Java程式碼中整合比特幣支援功能,例如建立地址、管理錢包、構造裸交易等,是Java工程師不可多得的比特幣開發學習課程。
- php比特幣開發教程,本課程面向初學者,內容即涵蓋比特幣的核心概念,例如區塊鏈儲存、去中心化共識機制、金鑰與指令碼、交易與UTXO等,同時也詳細講解如何在Php程式碼中整合比特幣支援功能,例如建立地址、管理錢包、構造裸交易等,是Php工程師不可多得的比特幣開發學習課程。
- tendermint區塊鏈開發詳解,本課程適合希望使用tendermint進行區塊鏈開發的工程師,課程內容即包括tendermint應用開發模型中的核心概念,例如ABCI介面、默克爾樹、多版本狀態庫等,也包括代幣發行等豐富的實操程式碼,是go語言工程師快速入門區塊鏈開發的最佳選擇。
匯智網原創翻譯,轉載請標明出處。這裡是原文比特幣指令碼語言