區塊鏈
可是,簡單易懂的入門文章卻很少。區塊鏈到底是什麼,有何特別之處,很少有解釋。
下面,我就來嘗試,寫一篇最好懂的區塊鏈教程。畢竟它也不是很難的東西,核心概念非常簡單,幾句話就能說清楚。我希望讀完本文,你不僅可以理解區塊鏈,還會明白什麼是挖礦、為什麼挖礦越來越難等問題。
需要說明的是,我並非這方面的專家。雖然很早就關注,但是仔細地瞭解區塊鏈,還是從今年初開始。文中的錯誤和不準確的地方,歡迎大家指正。
一、區塊鏈的本質
區塊鏈是什麼?一句話,它是一種特殊的分散式資料庫。
首先,區塊鏈的主要作用是儲存資訊。任何需要儲存的資訊,都可以寫入區塊鏈,也可以從裡面讀取,所以它是資料庫。
其次,任何人都可以架設伺服器,加入區塊鏈網路,成為一個節點。區塊鏈的世界裡面,沒有中心節點,每個節點都是平等的,都儲存著整個資料庫。你可以向任何一個節點,寫入/讀取資料,因為所有節點最後都會同步,保證區塊鏈一致。
二、區塊鏈的最大特點
分散式資料庫並非新發明,市場上早有此類產品。但是,區塊鏈有一個革命性特點。
區塊鏈沒有管理員,它是徹底無中心的。其他的資料庫都有管理員,但是區塊鏈沒有。如果有人想對區塊鏈新增稽核,也實現不了,因為它的設計目標就是防止出現居於中心地位的管理當局。
正是因為無法管理,區塊鏈才能做到無法被控制。否則一旦大公司大集團控制了管理權,他們就會控制整個平臺,其他使用者就都必須聽命於他們了。
但是,沒有了管理員,人人都可以往裡面寫入資料,怎麼才能保證資料是可信的呢?被壞人改了怎麼辦?請接著往下讀,這就是區塊鏈奇妙的地方。
三、區塊
區塊鏈由一個個區塊(block)組成。區塊很像資料庫的記錄,每次寫入資料,就是建立一個區塊。
每個區塊包含兩個部分。
- 區塊頭(Head):記錄當前區塊的特徵值
- 區塊體(Body):實際資料
區塊頭包含了當前區塊的多項特徵值。
- 生成時間
- 實際資料(即區塊體)的雜湊
- 上一個區塊的雜湊
- ...
這裡,你需要理解什麼叫雜湊(hash),這是理解區塊鏈必需的。
所謂"雜湊"就是計算機可以對任意內容,計算出一個長度相同的特徵值。區塊鏈的 雜湊長度是256位,這就是說,不管原始內容是什麼,最後都會計算出一個256位的二進位制數字。而且可以保證,只要原始內容不同,對應的雜湊一定是不同的。
舉例來說,字串123
的雜湊是a8fdc205a9f19cc1c7507a60c4f01b13d11d7fd0
(十六進位制),轉成二進位制就是256位,而且只有123
能得到這個雜湊。(理論上,其他字串也有可能得到這個雜湊,但是概率極低,可以近似認為不可能發生。)
因此,就有兩個重要的推論。
- 推論1:每個區塊的雜湊都是不一樣的,可以通過雜湊標識區塊。
- 推論2:如果區塊的內容變了,它的雜湊一定會改變。
四、 Hash 的不可修改性
區塊與雜湊是一一對應的,每個區塊的雜湊都是針對"區塊頭"(Head)計算的。也就是說,把區塊頭的各項特徵值,按照順序連線在一起,組成一個很長的字串,再對這個字串計算雜湊。
Hash = SHA256( 區塊頭 )
上面就是區塊雜湊的計算公式,SHA256
是區塊鏈的雜湊演算法。注意,這個公式裡面只包含區塊頭,不包含區塊體,也就是說,雜湊由區塊頭唯一決定,
前面說過,區塊頭包含很多內容,其中有當前區塊體的雜湊,還有上一個區塊的雜湊。這意味著,如果當前區塊體的內容變了,或者上一個區塊的雜湊變了,一定會引起當前區塊的雜湊改變。
這一點對區塊鏈有重大意義。如果有人修改了一個區塊,該區塊的雜湊就變了。為了讓後面的區塊還能連到它(因為下一個區塊包含上一個區塊的雜湊),該人必須依次修改後面所有的區塊,否則被改掉的區塊就脫離區塊鏈了。由於後面要提到的原因,雜湊的計算很耗時,短時間內修改多個區塊幾乎不可能發生,除非有人掌握了全網51%以上的計算能力。
正是通過這種聯動機制,區塊鏈保證了自身的可靠性,資料一旦寫入,就無法被篡改。這就像歷史一樣,發生了就是發生了,從此再無法改變。
每個區塊都連著上一個區塊,這也是"區塊鏈"這個名字的由來。
五、採礦
由於必須保證節點之間的同步,所以新區塊的新增速度不能太快。試想一下,你剛剛同步了一個區塊,準備基於它生成下一個區塊,但這時別的節點又有新區塊生成,你不得不放棄做了一半的計算,再次去同步。因為每個區塊的後面,只能跟著一個區塊,你永遠只能在最新區塊的後面,生成下一個區塊。所以,你別無選擇,一聽到訊號,就必須立刻同步。
所以,區塊鏈的發明者中本聰(這是假名,真實身份至今未知)故意讓新增新區塊,變得很困難。他的設計是,平均每10分鐘,全網才能生成一個新區塊,一小時也就六個。
這種產出速度不是通過命令達成的,而是故意設定了海量的計算。也就是說,只有通過極其大量的計算,才能得到當前區塊的有效雜湊,從而把新區塊新增到區塊鏈。由於計算量太大,所以快不起來。
這個過程就叫做採礦(mining),因為計算有效雜湊的難度,好比在全世界的沙子裡面,找到一粒符合條件的沙子。計算雜湊的機器就叫做礦機,操作礦機的人就叫做礦工。
六、難度係數
讀到這裡,你可能會有一個疑問,人們都說採礦很難,可是採礦不就是用計算機算出一個雜湊嗎,這正是計算機的強項啊,怎麼會變得很難,遲遲算不出來呢?
原來不是任意一個雜湊都可以,只有滿足條件的雜湊才會被區塊連結受。這個條件特別苛刻,使得絕大部分雜湊都不滿足要求,必須重算。
原來,區塊頭包含一個難度係數(difficulty),這個值決定了計算雜湊的難度。舉例來說,第100000個區塊的難度係數是 14484.16236122。
區塊鏈協議規定,使用一個常量除以難度係數,可以得到目標值(target)。顯然,難度係數越大,目標值就越小。
雜湊的有效性跟目標值密切相關,只有小於目標值的雜湊才是有效的,否則雜湊無效,必須重算。由於目標值非常小,雜湊小於該值的機會極其渺茫,可能計算10億次,才算中一次。這就是採礦如此之慢的根本原因。
前面說過,當前區塊的雜湊由區塊頭唯一決定。如果要對同一個區塊反覆計算雜湊,就意味著,區塊頭必須不停地變化,否則不可能算出不一樣的雜湊。區塊頭裡面所有的特徵值都是固定的,為了讓區塊頭產生變化,中本聰故意增加了一個隨機項,叫做 Nonce。
Nonce 是一個隨機值,礦工的作用其實就是猜出 Nonce 的值,使得區塊頭的雜湊可以小於目標值,從而能夠寫入區塊鏈。Nonce 是非常難猜的,目前只能通過窮舉法一個個試錯。根據協議,Nonce 是一個32位的二進位制值,即最大可以到21.47億。第 100000 個區塊的 Nonce 值是274148111
,可以理解成,礦工從0開始,一直計算了 2.74 億次,才得到了一個有效的 Nonce 值,使得算出的雜湊能夠滿足條件。
運氣好的話,也許一會就找到了 Nonce。運氣不好的話,可能算完了21.47億次,都沒有發現 Nonce,即當前區塊體不可能算出滿足條件的雜湊。這時,協議允許礦工改變區塊體,開始新的計算。
七、難度係數的動態調節
正如上一節所說,採礦具有隨機性,沒法保證正好十分鐘產出一個區塊,有時一分鐘就算出來了,有時幾個小時可能也沒結果。總體來看,隨著硬體裝置的提升,以及礦機的數量增長,計算速度一定會越來越快。
為了將產出速率恆定在十分鐘,中本聰還設計了難度係數的動態調節機制。他規定,難度係數每兩週(2016個區塊)調整一次。如果這兩週裡面,區塊的平均生成速度是9分鐘,就意味著比法定速度快了10%,因此接下來的難度係數就要調高10%;如果平均生成速度是11分鐘,就意味著比法定速度慢了10%,因此接下來的難度係數就要調低10%。
難度係數越調越高(目標值越來越小),導致了採礦越來越難。
八、區塊鏈的分叉
即使區塊鏈是可靠的,現在還有一個問題沒有解決:如果兩個人同時向區塊鏈寫入資料,也就是說,同時有兩個區塊加入,因為它們都連著前一個區塊,就形成了分叉。這時應該採納哪一個區塊呢?
現在的規則是,新節點總是採用最長的那條區塊鏈。如果區塊鏈有分叉,將看哪個分支在分叉點後面,先達到6個新區塊(稱為"六次確認")。按照10分鐘一個區塊計算,一小時就可以確認。
由於新區塊的生成速度由計算能力決定,所以這條規則就是說,擁有大多數計算能力的那條分支,就是正宗的區塊鏈。
九、總結
區塊鏈作為無人管理的分散式資料庫,從2009年開始已經執行了8年,沒有出現大的問題。這證明它是可行的。
但是,為了保證資料的可靠性,區塊鏈也有自己的代價。一是效率,資料寫入區塊鏈,最少要等待十分鐘,所有節點都同步資料,則需要更多的時間;二是能耗,區塊的生成需要礦工進行無數無意義的計算,這是非常耗費能源的。
因此,區塊鏈的適用場景,其實非常有限。
- 不存在所有成員都信任的管理當局
- 寫入的資料不要求實時使用
- 挖礦的收益能夠彌補本身的成本
如果無法滿足上述的條件,那麼傳統的資料庫是更好的解決方案。
目前,區塊鏈最大的應用場景(可能也是唯一的應用場景),就是以比特幣為代表的加密貨幣。下一篇文章,我將會介紹比特幣的入門知識。
十、參考連結
- How does blockchain really work?, by Sean Han
- Bitcoin mining the hard way: the algorithms, protocols, and bytes, by Ken Shirriff
(完)
相關文章
- 區塊鏈100講:區塊鏈為什麼叫“區塊”“鏈”?區塊鏈
- 區塊鏈知識,區塊鏈簡史區塊鏈
- 區塊鏈系列1-區塊鏈概述區塊鏈
- 區塊鏈 2.0:房地產區塊鏈(四)區塊鏈
- 1.3 初識區塊鏈:區塊鏈分類區塊鏈
- 區塊鏈以及區塊鏈技術總結區塊鏈
- 區塊鏈入門 -- 02 區塊鏈介紹區塊鏈
- 區塊鏈開發_建立區塊鏈公鏈,聯盟鏈,私有鏈區塊鏈
- 區塊鏈大火?區塊鏈究竟是什麼?區塊鏈
- “區塊”和“鏈”的火花,區塊鏈到底為何物區塊鏈
- 區塊鏈安全————區塊鏈技術安全討論區塊鏈
- 從區塊鏈公司角度,分析區塊鏈錢包區塊鏈
- 區塊鏈原理區塊鏈
- 區塊鏈技術公司談當婚姻遇到區塊鏈區塊鏈
- 區塊鏈公司談區塊鏈技術最新應用區塊鏈
- 區塊鏈100講:區塊鏈中的隨機數區塊鏈隨機
- 區塊鏈100講: 區塊鏈共識的確定性區塊鏈
- 量子計算與區塊鏈碰撞後——量子區塊鏈區塊鏈
- 區塊鏈特徵與區塊鏈技術應用落地區塊鏈特徵
- 什麼是區塊鏈,簡單瞭解區塊鏈區塊鏈
- 區塊鏈101:區塊鏈技術是如何工作的?區塊鏈
- 區塊鏈技術開發公司 聊區塊鏈“主鏈”價值區塊鏈
- 區塊鏈技術開發主鏈區塊鏈的應用分析區塊鏈
- 區塊鏈中的“跨鏈”區塊鏈
- 區塊鏈學習筆記01--區塊鏈常識區塊鏈筆記
- 區塊鏈公司暢談區塊鏈技術的價值區塊鏈
- 區塊鏈開發平臺_區塊鏈技術服務區塊鏈
- 區塊鏈開發公司區塊鏈與產業變革區塊鏈產業
- 區塊鏈2.0架構:以太坊區塊鏈的介紹區塊鏈架構
- 企業級區塊鏈:今天企業如何使用區塊鏈?區塊鏈
- 區塊鏈的幾個小故事.小白學區塊鏈01區塊鏈
- 區塊鏈系列6-區塊鏈安全與大資料區塊鏈大資料
- 區塊鏈3.0,人工智慧與區塊鏈的完美融合區塊鏈人工智慧
- 區塊鏈每日一問 | 什麼是區塊鏈的“分叉”?區塊鏈
- 區塊鏈簡介區塊鏈
- 區塊鏈初識區塊鏈
- 區塊鏈安全思考區塊鏈
- Qtum區塊鏈指南QT區塊鏈