文字上的演算法讀書筆記四--分散式系統

imagination_gogo發表於2018-10-10

原文網址 : https://blog.csdn.net/qq_24495287/article/details/82988974

演算法筆記分散式

第三篇應用篇

如何計算的更快

隨著資料量的爆炸式增長，如何儲存和計算海量資料就成了一個問題。解決的方法之一是使用分散式系統，可以更快更好的完成使用者的請求。

程式優化

程式執行時，經過將目標檔案中的程式碼和資料從磁碟拷貝到主存，從儲存器拷貝到暫存器堆，再從暫存器中拷貝到顯示器上。

花費大量的時間把資訊從一個地方拷貝到另一個地方。需要系統設計者考慮怎麼設計儲存器使拷貝操作儘可能快。

儲存器結構，越上層的速度越快但儲存量小，相反，越下層的速度越慢但儲存量大。

程式的優化有3個方向：

1）.系統級（分散式系統）

2）.演算法/資料結構級（傅立葉變換，trie樹，優先佇列，空間換時間）

3）.程式碼級

儘可能使用上層儲存器，訪問速度快，少呼叫函式，引數儘可能少，引數儘可能是引用和指標，減少拷貝，資料儘可能少

區域性性原理。

為什麼要分散式系統？

分散式模型大概有這幾種：

（1）多執行緒，最基本的方法

（2）graphics Processing units ，利用圖形處理器的高度並行結構來提高速度

（3）Message Passing Interface,一種訊息傳遞程式設計模型

（4）MapReduce

設計好分散式系統，需要考慮的事情比如：叢集負載均衡，資料的正確性和完整性，伺服器的錯誤處理等等。

4.3 Hadoop

軟體平臺，是Apache 開源組織的一個分散式計算開源框架，可以很容易地開發和執行處理海量資料的應用。核心設計是MapReduce和HDFS,可以認為是基於HDFS的MapReduce的實現。

分散式分解系統（HDFS）

採用master/slave架構。包括Namenode和Datanode。

Namenode是中心伺服器，負責管理檔案系統的名字空間以及客戶端對檔案的訪問。

Datanode一般是一個節點一個，負責管理所在節點上的儲存。

MapReduce

用來處理鍵/值對。Map輸出鍵值對，Reduce輸出鍵值對。

如統計詞頻，假設有一堆分好的詞，現在的任務是統計每個詞出現的次數。

首先將文字分成若干份，然後每一份資料，分配給一個Mapper，將每個詞賦值為1，然後按照某種規律（字母序，這樣同一個詞才能分配到一個Reducer）發給相應的Reducer，Reducer就是把相同的key的value累加起來，這樣完成統計詞頻。

《分散式快取》讀書筆記二
2019-01-27
分散式快取筆記
文字上的演算法讀書筆記五--nlp的需要知道的術語
2018-10-11
演算法筆記
分散式系統學習筆記
2019-04-05
分散式筆記
分散式系統架構筆記
2024-11-06
分散式架構筆記
《大型網站系統與Java中介軟體》讀書筆記（上）
2019-06-10
網站Java筆記
分散式系統的Raft演算法
2018-11-19
分散式Raft演算法
《你不知道的JavaScript》 (上) 讀書筆記
2019-01-08
JavaScript筆記
讀書筆記 – 你不知道的 JavaScript(上)
2019-02-28
筆記JavaScript
分散式系統閱讀清單
2024-04-21
分散式
讀書筆記
2024-06-04
筆記
《讀書與做人》讀書筆記
2024-06-14
筆記
[轉帖]System Performance 讀書筆記 - 作業系統（1）
2024-05-17
ORM筆記作業系統
【讀書筆記】如何設計一個秒殺系統
2020-12-27
筆記
反應式程式設計讀書筆記
2024-03-18
程式設計筆記
分散式系統原理---CBCAST演算法
2020-11-26
分散式AST演算法
《Go 語言程式設計》讀書筆記（四）介面
2019-12-28
Go程式設計筆記
現代作業系統-原理與實現【讀書筆記】
2020-11-22
作業系統筆記
webpackDemo讀書筆記
2018-07-30
Web筆記
Vue讀書筆記
2018-05-02
Vue筆記
散文讀書筆記
2018-08-26
筆記
Cucumber讀書筆記
2020-04-06
筆記
HTTP 讀書筆記
2018-03-05
HTTP筆記
postgres 讀書筆記
2024-11-19
筆記
讀書筆記2
2024-10-30
筆記
讀書筆記3
2024-06-19
筆記
分散式系統2：分散式系統中的時鐘
2024-10-13
分散式
分散式 - 分散式系統的特點
2019-05-16
分散式
MySQL 讀書筆記（一）體系結構
2019-08-11
MySql筆記
AspNetCore分散式檔案上傳系統
2019-05-10
NetCore分散式
【大資料】BigTable分散式資料儲存系統分散式資料庫 | 複習筆記
2020-12-12
大資料分散式資料庫筆記
讀書筆記（四）：深度學習基於Keras的Python實踐
2020-11-11
筆記深度學習KerasPython
維度處理-資料倉儲-讀書筆記(四)
2018-08-22
筆記
Java 併發程式設計實踐讀書筆記四
2020-12-13
Java程式設計筆記
五月的讀書筆記
2018-06-04
筆記
《孩子的大腦》讀書筆記
2024-07-19
筆記
js高程讀書筆記
2018-04-09
JS筆記
《論語》讀書筆記
2024-07-10
筆記
《重構》讀書筆記
2021-03-06
筆記