通過激勵協作實現語義 Web 的弱中心化

leinue發表於2019-04-09
本文由 SoLiD 中文社群 翻譯自:ruben.verborgh.org/articles/in…

個人隱私資料正在以一種前所未有的規模被大量使用,由此引發了 Facebook + Equifax、Google Plus 等大公司的隱私醜聞事件。去中心化只是個烏托邦,我們不談去中心化,只談弱中心化。個人資料的弱中心化可以讓普通人控制他們的資料(尤其是網路資料),語義網技術可以讓資料整合變的更快。但是,對於弱中心化的資料處理需要更復雜的演算法,由此需要更強大的算力。由於不是中心化的資料處理中心,各個資料節點的處理能力更低(你是否想到了邊緣計算?)。本文介紹了一個願景,使用分散式賬本進行資料處理協作,並激勵網路中的各節點。通過利用所有節點的集體處理能力,我們可以尋求除了當前「集中式計算機房」外另外的替代方案,使人們能夠在不影響功能的情況下重新獲得資料的所有權。

通過弱中心化個人資料的儲存來重新獲得資料的控制權

在過去的幾年裡,我們目睹了網路上個人資料前所未有的集中化。無論你同意與否,大型社交媒體都在收集我們的資訊,並在其強大的資料處理中心儲存和分發這些資訊。人們為了獲取更好的服務,不得不將資料共享給軟體服務商。例如,在 Facebook 上,包含家庭成員的相簿會上傳進去。Equifax 和 Facebook 的嚴重隱私醜聞讓我們看到了將大量資料集中在一處可能產生的風險。而重新獲得對資料的控制權是全球資訊網發明人 Tim Berners-Lee 在 2017 年制定的三個主要挑戰中的兩個。

讓人們重新控制資料的方式是允許資料儲存在他們想儲存的任何地方,而這和他們想要使用的應用程式無關。這是 SoLiD 等計劃背後的核心思想:資料是分散的,是弱中心化的,每個人都可以將資料儲存在自己的空間中,並且應用程式與資料分離,因為使用 A 應用程式建立的資源可以被 B 應用程式讀取和修改。

通過激勵協作實現語義 Web 的弱中心化
應用程式無權要求所有權,而是從分散的資料中心查詢資料

上圖是一個示例,可以看到社交應用的資料來源是由其他應用程式建立的圖片或者會議事件。此外,通過從多個儲存位置查詢資料來構建社交推送,而無需事先集中收集資料,也是 SoLiD 的一個核心亮點。這樣,人們就可以自由選擇他們的儲存提供商和他們的應用程式提供商,並可以隨意轉移他們的資料。他們可以讓應用程式,其他人或公司在他們認為合適的時候訪問其資料的特定部分,並在任何給定的時間點撤銷或限制該許可權。這可以實現真早的資料所有權和完全控制。

由於這種方式需要處理相同的資料,所以需要一份標準協議,這可以通過 RDF、SPARQL 等語義網技術實現。開發者可以通過選擇被廣泛認可的本體來表示資料,每個人都可以自由選擇他們的本體,並且由於語義學的存在,推理可以彌合本體間的差異。換句話說,關聯資料(Linked Data)的弱中心化特質和 RDFS 、OWL 的不協調性質非常適合 SoLiD 的目標。

弱中心化的效能問題

與集中式計算中心相比,弱中心化的系統面臨著兩個問題:

  1. 單個節點不僅要解決更難的問題,所擁有的資源也更少;
  2. 由於分散式,弱中心化資料處理比集中式資料處理需要更多的計算能力和網路頻寬;

此外,現在很多資料處理演算法還沒有為弱中心化的資料處理做好準備。我們舉一個簡單但實際的例子,構建具有 500 個朋友的社交網路推送,在最壞情況下需要執行對 500 個不同資料來源的查詢,其中每個人朋友將他們的資料儲存在不同的位置。最先進的 SPARQL 查詢引擎只需要查詢十幾次。相比之下,弱中心化的資料儲存將需要聯合查詢數百個小型資料集。資料來源的選擇策略對於效能至關重要。

最後,通過查詢連結暴露個人資料儲存帶來了安全問題上的挑戰。聯合 SPARQL 查詢通常在私有網路中進行測試。在公共 Web 上,SPARQL EndPoint 長期以來一直受到可用性問題的影響,無論是技術原因還是管理原因,這些問題至少可以通過個人資料的掌控權表現出不可忽視的風險。當資料在越來越多的節點上傳播後,我們可能遇到嚴重的頻寬使用問題和查詢速度下降問題。

通過多方協作最大化效能

若中心化網路具有特定資產:即使單個節點與大規模伺服器叢集相比資源有限,但總體而言,這些節點具有更大的計算能力和頻寬。每個單獨的個人資料儲存以及每個客戶端(計算機、智慧手機、平板電腦)都會使用自己的 CPU - 這些 CPU 在集中式環境中通常未得到充分利用。如果我們找到可以讓這些節點協作的方法,我們就可以解決弱中心化網路中的資源問題。如果我們採取優化措施,例如在最接近資料的節點上執行計算工作(也就是所謂的「邊緣計算」),我們就可以抵消由於弱中心而產生的演算法複雜度提升。

我們可以把這種理念應用於應用程式的資料收集階段,在弱中心化網路中,這相當於聯合查詢(從不同的資料儲存中心上查詢)。社交媒體通常包含重疊的人群,因此任何人都可能成為其他人的聯絡人。所以,我們可以達成一個共識,也就是,如果你幫助我執行了我的查詢,我也可以幫助你執行你的查詢。然後,我們就可以將更大的子查詢並行的委託給 10 個或 20 個節點,而不是將子查詢傳送到例如 500 個節點。因此,我們不是在伺服器或客戶端完全執行資料收集,而是通過網路動態地重新分配查詢執行。

通過分散式賬本提供激勵和信任

為了實現可持續的協作,需要激勵節點充當網路的貢獻者。否則,節點無法確定,如果它在空閒時幫助其他節點,則其他節點需要記錄此節點的優先順序。但是,當建立激勵時,節點可能會產生不誠信問題,因此我們需要一種信任機制來驗證工作是否正確完成。由於在弱中心化網路中不存在集中式的實體,我們需要一種弱中心化的共識來建立這種激勵和信任。這可以通過分散式賬本來實現,它可以跟蹤所執行的工作,從而獲得其他人的幫助。

一類分散式賬本是區塊鏈,需要證明才能在賬本中新增內容。比特幣是以無意義計算而聞名,但較新型別的區塊鏈專案(比如 Filecoin)為此引入了更有意義的計算。使用 Filecoin,人們可以向其他人安全的儲存和檢索他們的資料,並且複製證明和時空證明會確認資料始終存在。我們同樣需要開發一個查詢證明結果,它既可以捕獲所執行的工作,也可以捕獲結果的正確性。

下面這張圖顯示了網路中單個節點的架構體系。當一個查詢到達時,該節點確定它願意接受的激勵和願意為其他人支付的激勵。在可能委派了一些工作並自行執行完成之後,它會保留資料的出處並生成結果的正確性證明。整個交易在區塊鏈上註冊,以便所有參與者都能獲得獎勵。某些節點可能會提前計算常見查詢的部分結果,或者快取常見資料以加快查詢速度。

通過激勵協作實現語義 Web 的弱中心化
網路中的每個節點都有一個查詢處理器,可以自己執行查詢或把部分委託給其他人。激勵模型會捕獲所需要的獎勵、出處和提供正確性保證。執行任務及其激勵措施會記錄在區塊鏈上。

預計影響

在目前的弱中心化語義資料網路中,整個想法先於了市場發展。上面的一些示例只是說明了對個人資料查詢的委託,還可以將其作為其他服務,比如將資料轉換為不同本體的推理。所有這些應用程式都依賴於客戶端 CPU 在大多數時間屬於空閒狀態的原則,也就是說,當我們不需要使用 CPU 時將其借給其他人使用,當我們 CPU 不夠用時可以委託其他人幫助我們計算。

這份提案將對語義網技術的規模化成長產生巨大影響,尤其是在缺乏明確業務模型的情況下。它為弱中心化演算法開闢了新的方向,並在語義網和「agent」代理理論指南建立了聯絡,同時還應用了經濟模型中的激勵措施。當然我們還要注意隱私等問題,也許我們可以通過加密來保證安全。最重要的是,這個願景向大小玩家都勾畫出了一個面向 Web 的語義 Web 之路。

參考文獻

[1]Berners-Lee, T. (2017), “Three challenges for the Web, according to its inventor”, World Wide Web Foundation, March, available at:webfoundation.org/2017/03/web….

[2]Mansour, E., Sambra, A.V., Hawke, S., Zereba, M., Capadisli, S., Ghanem, A., Aboulnaga, A., et al. (2016), “A Demonstration of the Solid Platform for Social Web Applications”, inCompanion Proceedings of the 25thInternational Conference on World Wide Web, pp.223–226, available at:crosscloud.org/2016/www-ma….

[3]Buil-Aranda, C., Hogan, A., Umbrich, J. and Vandenbussche, P.-Y. (2013), “SPARQLWeb-Querying Infrastructure: Ready for Action?”, inProceedings of the 12thInternational Semantic Web Conference, available at:aran.library.nuigalway.ie/handle/1037….

[4]Verborgh, R., Vander Sande, M., Hartig, O., Van Herwegen, J., De Vocht, L., De Meester, B., Haesendonck, G., et al. (2016), “Triple Pattern Fragments:a Low-cost Knowledge Graph Interface for the Web”,Journal of Web Semantics, Vol.37–38, pp.184–206, available at:linkeddatafragments.org/publication….

[5]Nakamoto, S. (2008), “Bitcoin: APeer-to-Peer Electronic Cash System”, available at:bitcoin.org/bitcoin.pdf.

[6]Filecoin: A Decentralized Storage Network, Whitepaper. (2017), , Protocol Labs, available at:filecoin.io/filecoin.pd….

[7]Grubenmann, T., Dell’Aglio, D., Bernstein, A., Moor, D. and Seuken, S. (2017), “Decentralizing the Semantic Web: Who will pay to realize it?”, inProceedings of the Workshop on Decentralizing the Semantic Web, available at:ceur-ws.org/Vol-1934/co….


相關文章