【區塊鏈】前沿分享-基於區塊鏈技術的機器學習行業概述

產業智慧官發表於2018-04-05

以區塊鏈市場資料為基礎的訓練出來的機器學習有可能創造出世界上最強大的人工智慧。它們結合了兩個強大的源力:私有機器學習，它允許在敏感的私有資料上進行訓練而不洩露資料；以及基於區塊鏈的激勵措施（incentive），它可以使這些系統獲取最佳資料和模型，使它們變得更智慧。結果是開放的市場，任何人都可以出售他們的資料，並保護他們的資料隱私，而開發人員可以利用激勵措施來獲得他們的演算法所需要的最佳資料。
構建這些系統是一項挑戰，必要的構建塊仍在建立中，但簡單的初始版本似乎已開始成為可能。我相信這些市場將把我們從目前的Web 2.0資料壟斷時代轉變為一個資料和演算法公開競爭的Web 3.0時代，兩者都直接貨幣化。

起源

這個想法的基礎來自於2015年與Numerai的理查德的談話。Numerai是一家對衝基金公司，它將加密的市場資料傳送給任何希望參與股市建模競爭的資料科學家。Numerai將最佳模型提交組合成一個“元模型”，交易該元模型，並向模型效能良好的資料科學家支付報酬。
讓資料科學家之間進行競爭似乎是一個強大的想法。所以它讓我想到:是否可以建立一個完全分散的系統版本，可以推廣到任何問題？我相信答案是肯定的。

構建

    例如，讓我們嘗試建立一個完全分散的系統，用於在分散的交易所之間交易密碼貨幣。這是許多潛在構件之一:
    資料：資料提供者將資料與模型相關聯並提供給建模人員。
    模型構建（Model Building）：建模人員選擇需要使用的資料並建立模型。

訓練是使用一種安全的計算方法來完成的，該方法允許在不暴露底層資料的情況下訓練模型。模型也被固定了。

    元模型（Metamodel）構建：元模型是基於每個固定的模型的為基礎構造的演算法建立的。
建立元模型是可選的—構造模型時，也可以不適用一些元模型。
    使用元模型：一個智慧協議（smart contract）將獲取元模型，通過鏈上分散的交換機制（Decentralized exchange mechanism on-chain）以程式設計方式進行交易。
    分散gains/losses：經過一段時間後，交易會產生利潤（profits）或loss。這種profits或loss在元模型的貢獻者之間根據他們的聰明程度進行分配。起負貢獻的模型採用了部分或全部的注資（staked funds）。然後，模型會發生變化，並對其資料提供者執行類似的分發/stake。
    驗證性計算：每個步驟的計算或者使用諸如Truebit的驗證遊戲集中執行，但是可以驗證和挑戰，或者使用安全多方計算（secure multiparty computation）分散執行。
    託管（Hosting）：資料和模型或者託管在IPFS上，或者託管在安全多方計算網路中的節點上，因為鏈上儲存太昂貴。

是什麼使這個系統強大？

    吸引全球最佳資料的激勵措施：吸引資料的激勵措施是系統中最有效的部分，因為資料往往是大多數機器學習系統中最重要的部分。就像比特幣通過開放式激勵機制建立了一個擁有全球最高計算能力的應急系統一樣，一個經過適當設計的資料激勵結構將使你的的應用程式獲得世界上最好的資料。而且幾乎不可能關閉一個可以從數千或數百萬來源獲取資料的系統。
    演算法之間的競爭：在不同的模型/演算法之間建立一個公開的競爭，在以前是不存。想象一下一個分散的Facebook上有成千上萬種相互競爭的新聞推薦演算法。
    報酬的透明度：資料和模型提供者可以看到他們得到了他們所提交的資料的公正的價值，因為所有計算都是可驗證的，這使得他們更有可能參與。
    自動化：在鏈上執行操作並直接在token中生成值的方法，建立了一個自動化且不可信的閉環系統。
    網路效應：來自使用者、資料提供者和資料科學家的多方面網路效應使系統自我強化（self-reinforce）。它表現得越好，吸引的資本就越多，這就意味著潛在的回報也就越多，這就吸引了更多的資料提供商和資料科學家，他們使系統變得更智慧，從而吸引了更多的資本，然後又回到原來的位置。

隱私

除了以上幾點之外，一個主要特徵是隱私。它允許1 )人們提交一些會太私人而無法共享的資料，2 )防止資料和模型的經濟價值洩露。如果未加密，資料和模型將被免費複製，並由沒有貢獻任何工作的人使用(“搭便車（Free rider）”問題)。

Free rider問題的一些解決方案是私下出售資料。即使購買者選擇轉售或釋出資料，其價值也會隨著時間而衰減。然而，這種方法限制了我們的短時用例，並且仍然產生典型的隱私問題。因此，更復雜但更強大的方法是使用一種安全計算的方法。

安全計算

安全計算方法允許模型在不暴露資料本身的情況下對資料進行訓練。目前使用和研究的安全計算主要有三種形式:同態加密(Homomorphic encryption，HE )、安全多方計算(secure multi-party computation，MPC )和零知識證明(zero knowledge proofs，ZKPs )。多方計算是木器於私有機器學習最常用的方法，因為同態加密往往太慢，如何將ZKPs應用於機器學習還不清楚。安全計算方法正處於電腦科學研究的前沿。它們通常比常規計算慢幾個數量級，是系統的主要瓶頸，但近年來一直在改進。

最終推薦系統（Ultimate Recommender System）

    為了說明私人機器學習的潛力，想象一個叫做“最終推薦系統”的應用。它會監視你在裝置上所做的一切:瀏覽歷史記錄、應用程式中所做的一切、手機上的圖片、位置資料、消費歷史記錄、可穿戴感測器、簡訊、家中的相機、未來AR眼鏡上的相機。然後它會給你一些建議:你應該訪問的下一個網站，要閱讀的文章，要聽的歌曲，或者要購買的產品。
    這種推薦系統將是非常有效的。比Google、Facebook或其他公司現有的任何資料都要多，因為它可以最大限度地縱向檢視您的資訊，並且可以從本來就太私人而無法考慮共享的資料中學習。類似於先前的密碼貨幣交易系統，它將通過允許集中於不同領域的模型市場(例如:網站推薦、音樂)來競爭對加密資料的訪問許可權，並向您推薦內容，甚至可能會因為您貢獻了資料或關注了生成的推薦而向您付費。
    Google的聯合學習（federated learning）和Apple的差異隱私（differential privacy）是這種私人機器學習方向實用化發展的一步，但仍然需要信任，不允許使用者直接檢查他們的安全性，並保持資料私有化。

現行辦法

太早了。沒有幾個小組有任何工作，大多數人都試圖一次能往前進一大步。
Algoria Research的一個簡單框架（construction）為準確超過某個回溯測試閾值的模型提供獎勵:

    Algorithmia Research在機器學習模型上建立獎勵的簡單框架
    Numerai目前更進一步，採取了三個步驟:使用加密資料(雖然不是完全同態)，將眾包模型組合成元模型，並且基於未來的效能(在本例中，是一週的股票交易)而不是通過名為Numeraire的本地 Ethereum token進行回溯測試。資料科學家必須在遊戲中以數字作為賭注，在將要發生的事情(未來的表現)上鼓勵人們表現（performance），而不是在已經發生的事情(事後測試的表現)上表現。但是，目前集中分發資料，限制了最重要的內容。
    迄今為止，還沒有人成功建立基於區塊鏈技術的資料市場。Ocean公司最早嘗試去勾勒這個市場的框架。
    還有一些公司則開始構建安全的計算網路。Openmined正在建立一個多方（multiparty）計算機網路，用於在Unity之上訓練機器學習模型，該網路可以在任何裝置上執行，包括遊戲控制檯(類似於在家裡Folding)，然後擴充套件到安全的MPC。Enigma也有類似的策略。
    一個令人著迷的最終狀態是相互擁有的元模型，它賦予資料提供者和模型建立者與他們變得聰明程度成正比的所有權。這些模型將被標記化，可以隨著時間的推移而產生紅利，甚至可能由訓練它們的人來管理。一種相互擁有的蜂箱思維（Hive mind）。原始的開放視訊是我迄今為止看到的最接近的結構。

哪些方法可能首先起作用？

我不會說什麼是最好的、最精確的結構，但我有一些想法。
我用來評價區塊鏈思想的一個觀點是:在一系列物理上（physically）的native到數字上（digitally）的native，再到區塊鏈（blockchain）的native，區塊鏈native越多越好。區塊鏈native越少，引入的第三方就越可信，從而增加了複雜性並降低了與其他系統一起作為構建塊的易用性。

在這裡，我認為這意味著，如果創造的價值是可以量化的，那麼一個系統更有可能發揮作用—理想的是直接以貨幣的形式，更好的是以token的形式。這使得一個清潔的閉環系統（clean，closed-loop system）成為可能。將密碼貨幣交易系統的先例與在X射線中識別腫瘤的例子進行比較。在後一種情況下，您需要讓保險公司相信X射線模型是有價值的，協商其價值，然後找一群實際在場的一小群人來驗證模型的成敗。
這並不是說更清楚且肯定的、社會的數字native相關的用途不會出現。像前面提到的推薦系統可能非常有用。如果連線到營銷市場，則是另一種情況，在這種情況下，模型可以以程式設計方式在鏈上執行操作，系統的回報是token(在這種情況下，來自營銷市場)，從而再次建立一個乾淨的閉環。現在看起來很模糊，但我預計區塊鏈native任務的範圍會隨著時間的推移而擴大。

意義

第一，分散的機器學習市場可以打破當前科技巨頭的資料壟斷。過去20年來，它們使網際網路價值創造的主要來源標準化和商品化:專有資料網路及其強大的網路效應。因此，價值建立將從資料向上移動到演算法。

技術領域的標準化和商品化週期，資料壟斷的網路時代即將結束

    換句話說，他們為人工智慧建立了一個直接的商業模式。同時Feeding和訓練它。
    第二，它們創造了世界上最強大的人工智慧系統，通過直接的經濟激勵（economic incentives）吸引了最好的資料和模型。它們的強度（strength）通過多面網路效應（multi-sided network effects）而增加。隨著Web 2.0時代的資料網路壟斷變得商品化，它們似乎是下一個重聚合點（re-aggregation）的理想選擇。我們可能離這點還有幾年時間，但方向似乎是正確的。
    第三，如推薦系統例子所示，搜尋得到反轉。不是人們搜尋產品，而是產品搜尋和使用者的競爭。每個人都可能有自己的推薦市場，推薦系統在那裡競爭把最相關的內容放在他們的feed中，相關性是由個人定義的。
    第四，它們可以讓我們從谷歌和Facebook等公司那裡得到同樣的好處，而不用洩露我們的資料。
    第五，機器學習可以更快進步，因為任何工程師都可以訪問開放的資料市場，而不僅僅是大型Web 2.0公司中的一小部分工程師。

挑戰

    首先，安全計算方法目前非常慢，並且機器學習目前非常消耗計算資源。另一方面，人們對安全計算方法的興趣開始升溫，效能也在不斷提高。在過去的6個月中，我看到了HE、MPC和ZKPs提出了顯著改進效能的新方法。
    將特定資料集或模型提供給元模型（metamodel）計算是很困難的。
    清理和格式化眾包資料具有挑戰性。我們可能會看到一些將工具、標準化和小型企業（small businesses）的組合來解決這個問題。
    最後，具有諷刺意味的是，建立這種系統的通用結構的業務模型不如建立單個例項清晰。這似乎對於許多新的crypto primitive是真的，包括curation market。

結論

將私人機器學習與區塊鏈incentives相結合可以在各種各樣的應用中產生最強的機器智慧。隨著時間的推移，有一些重大的技術挑戰可以被解決。他們的長期潛力是巨大的，這是一個可喜的轉變，擺脫了目前大型網際網路公司對資料的掌控。它們也有點可怕—它們引導自己生存、自我強化、消耗私人資料，而且幾乎無法關閉，這讓我懷疑建立它們是否比以往任何時候都更能召喚出一個強大的Moloch。無論如何，它們是另一個例子，說明密碼貨幣（cryptocurrencies）是如何慢慢進入各個行業的。

640?wx_fmt=png

人工智慧賽博物理作業系統

AI-CPS OS

“人工智慧賽博物理作業系統”（新一代技術+商業作業系統“AI-CPS OS”：雲端計算+大資料+物聯網+區塊鏈+人工智慧）分支用來的今天，企業領導者必須瞭解如何將“技術”全面滲入整個公司、產品等“商業”場景中，利用AI-CPS OS形成數字化+智慧化力量，實現行業的重新佈局、企業的重新構建和自我的煥然新生。

AI-CPS OS的真正價值並不來自構成技術或功能，而是要以一種傳遞獨特競爭優勢的方式將自動化+資訊化、智造+產品+服務和資料+分析一體化，這種整合方式能夠釋放新的業務和運營模式。如果不能實現跨功能的更大規模融合，沒有顛覆現狀的意願，這些將不可能實現。

領導者無法依靠某種單一戰略方法來應對多維度的數字化變革。面對新一代技術+商業作業系統AI-CPS OS顛覆性的數字化+智慧化力量，領導者必須在行業、企業與個人這三個層面都保持領先地位：

重新行業佈局：你的世界觀要怎樣改變才算足夠？你必須對行業典範進行怎樣的反思？
重新構建企業：你的企業需要做出什麼樣的變化？你準備如何重新定義你的公司？
重新打造自己：你需要成為怎樣的人？要重塑自己並在數字化+智慧化時代保有領先地位，你必須如何去做？

AI-CPS OS是數字化智慧化創新平臺，設計思路是將大資料、物聯網、區塊鏈和人工智慧等無縫整合在雲端，可以幫助企業將創新成果融入自身業務體系，實現各個前沿技術在雲端的優勢協同。AI-CPS OS形成的數字化+智慧化力量與行業、企業及個人三個層面的交叉，形成了領導力模式，使數字化融入到領導者所在企業與領導方式的核心位置：

精細：這種力量能夠使人在更加真實、細緻的層面觀察與感知現實世界和數字化世界正在發生的一切，進而理解和更加精細地進行產品個性化控制、微觀業務場景事件和結果控制。
智慧：模型隨著時間（資料）的變化而變化，整個系統就具備了智慧（自學習）的能力。
高效：企業需要建立實時或者準實時的資料採集傳輸、模型預測和響應決策能力，這樣智慧就從批量性、階段性的行為變成一個可以實時觸達的行為。
不確定性：數字化變更顛覆和改變了領導者曾經仰仗的思維方式、結構和實踐經驗，其結果就是形成了複合不確定性這種顛覆性力量。主要的不確定性蘊含於三個領域：技術、文化、制度。
邊界模糊：數字世界與現實世界的不斷融合成CPS不僅讓人們所知行業的核心產品、經濟學定理和可能性都產生了變化，還模糊了不同行業間的界限。這種效應正在向生態系統、企業、客戶、產品快速蔓延。

AI-CPS OS形成的數字化+智慧化力量通過三個方式激發經濟增長：

創造虛擬勞動力，承擔需要適應性和敏捷性的複雜任務，即“智慧自動化”，以區別於傳統的自動化解決方案；
對現有勞動力和實物資產進行有利的補充和提升，提高資本效率；
人工智慧的普及，將推動多行業的相關創新，開闢嶄新的經濟增長空間。

給決策制定者和商業領袖的建議：

超越自動化，開啟新創新模式：利用具有自主學習和自我控制能力的動態機器智慧，為企業創造新商機；
迎接新一代資訊科技，迎接人工智慧：無縫整合人類智慧與機器智慧，重新
評估未來的知識和技能型別；
制定道德規範：切實為人工智慧生態系統制定道德準則，並在智慧機器的開
發過程中確定更加明晰的標準和最佳實踐；
重視再分配效應：對人工智慧可能帶來的衝擊做好準備，制定戰略幫助面臨
較高失業風險的人群；
開發數字化+智慧化企業所需新能力：員工團隊需要積極掌握判斷、溝通及想象力和創造力等人類所特有的重要能力。對於中國企業來說，創造兼具包容性和多樣性的文化也非常重要。

子曰：“君子和而不同，小人同而不和。” 《論語·子路》雲端計算、大資料、物聯網、區塊鏈和人工智慧，像君子一般融合，一起體現科技就是生產力。

如果說上一次哥倫布地理大發現，擴充的是人類的物理空間。那麼這一次地理大發現，擴充的就是人們的數字空間。在數學空間，建立新的商業文明，從而發現新的創富模式，為人類社會帶來新的財富空間。雲端計算，大資料、物聯網和區塊鏈，是進入這個數字空間的船，而人工智慧就是那船上的帆，哥倫布之帆！

新一代技術+商業的人工智慧賽博物理作業系統AI-CPS OS作為新一輪產業變革的核心驅動力，將進一步釋放歷次科技革命和產業變革積蓄的巨大能量，並創造新的強大引擎。重構生產、分配、交換、消費等經濟活動各環節，形成從巨集觀到微觀各領域的智慧化新需求，催生新技術、新產品、新產業、新業態、新模式。引發經濟結構重大變革，深刻改變人類生產生活方式和思維模式，實現社會生產力的整體躍升。

產業智慧官 AI-CPS

用“人工智慧賽博物理作業系統”（新一代技術+商業作業系統“AI-CPS OS”：雲端計算+大資料+物聯網+區塊鏈+人工智慧），在場景中構建狀態感知-實時分析-自主決策-精準執行-學習提升的認知計算和機器智慧；實現產業轉型升級、DT驅動業務、價值創新創造的產業互聯生態鏈。

640?wx_fmt=png

長按上方二維碼關注微信公眾號： AI-CPS，更多資訊回覆：

新技術：“雲端計算”、“大資料”、“物聯網”、“區塊鏈”、“人工智慧”；新產業：“智慧製造”、“智慧金融”、“智慧零售”、“智慧駕駛”、“智慧城市”；新模式：“財富空間”、“工業網際網路”、“資料科學家”、“賽博物理系統CPS”、“供應鏈金融”。

官方網站：AI-CPS.NET

本文系“產業智慧官”（公眾號ID：AI-CPS）收集整理，轉載請註明出處！

版權宣告：由產業智慧官（公眾號ID：AI-CPS）推薦的文章，除非確實無法確認，我們都會註明作者和來源。部分文章推送時未能與原作者取得聯絡。若涉及版權問題，煩請原作者聯絡我們，與您共同協商解決。聯絡、投稿郵箱：erp_vip@hotmail.com

區塊鏈技術工坊 - 線下區塊鏈技術分享
2018-12-12
區塊鏈
區塊鏈溯源-基於區塊鏈技術-全程追溯防偽
2020-12-25
區塊鏈
區塊鏈技術學習指引
2018-05-10
區塊鏈
區塊鏈以及區塊鏈技術總結
2018-07-09
區塊鏈
區塊鏈系列1-區塊鏈概述
2018-08-07
區塊鏈
區塊鏈101：區塊鏈技術是如何工作的?
2018-04-17
區塊鏈
區塊鏈技術
2020-12-29
區塊鏈
學習下區塊鏈技術基礎知識
2018-11-21
區塊鏈
區塊鏈安全————區塊鏈技術安全討論
2018-06-18
區塊鏈
【區塊鏈學習】《區塊鏈學習指南》學習筆記
2018-03-15
區塊鏈筆記
區塊鏈公司暢談區塊鏈技術的價值
2019-03-15
區塊鏈
區塊鏈技術開發主鏈區塊鏈的企業級應用剖析
2018-08-21
區塊鏈
區塊鏈技術開發主鏈區塊鏈的應用分析
2022-06-13
區塊鏈
區塊鏈技術開發公司淺析區塊鏈對能源行業的影響
2018-06-11
區塊鏈行業
區塊鏈技術公司談當婚姻遇到區塊鏈
2018-10-17
區塊鏈
區塊鏈公司談區塊鏈技術最新應用
2019-03-16
區塊鏈
區塊鏈特徵與區塊鏈技術應用落地
2019-12-07
區塊鏈特徵
區塊鏈行業的機會
2018-04-16
區塊鏈行業
區塊鏈學習
2018-06-09
區塊鏈
區塊鏈的核心技術
2018-07-23
區塊鏈
區塊鏈技術發展_區塊鏈技術開發新方向
2019-01-17
區塊鏈
區塊鏈溯源技術是什麼？區塊鏈溯源技術開發
2020-11-30
區塊鏈
區塊鏈技術開發公司聊區塊鏈“主鏈”價值
2018-08-23
區塊鏈
區塊鏈開發平臺_區塊鏈技術服務
2019-03-07
區塊鏈
區塊鏈技術的領先的區塊鏈數字資產
2023-12-07
區塊鏈
區塊鏈技術公司區塊鏈的應用場景思路剖析
2018-08-21
區塊鏈
雲+區塊鏈實現區塊鏈技術的普惠應用
2020-01-14
區塊鏈
區塊鏈發展歷程，區塊鏈技術的落地應用
2020-11-25
區塊鏈
區塊鏈應技術應用開發方案,區塊鏈技術為企業賦能
2019-12-05
區塊鏈
BAAS平臺_區塊鏈baas平臺技術_區塊鏈技術開發
2019-01-28
區塊鏈
區塊鏈技術研發，如今最契合區塊鏈技術應用方向
2020-12-16
區塊鏈
區塊鏈溯源技術，區塊鏈溯源防偽解決方案
2020-12-01
區塊鏈
區塊鏈技術無罪
2018-03-05
區塊鏈
區塊鏈-技術簡介
2018-03-30
區塊鏈
區塊鏈技術開發
2022-06-07
區塊鏈
浙商銀行：2020年基於區塊鏈技術的供應鏈金融白皮書
2021-01-02
區塊鏈
區塊鏈不談技術的都是韭菜——區塊鏈技術組成及架構
2018-03-09
區塊鏈架構
區塊鏈學習筆記01--區塊鏈常識
2018-12-23
區塊鏈筆記

【區塊鏈】前沿分享-基於區塊鏈技術的機器學習行業概述

相關文章