如何構建高擴充套件性網站?

xingoo發表於2015-04-17

本篇通過閱讀《高擴充套件性網站的50條原則》,總結出以下內容。

一方面博主沒有實際的架構經驗,另一方面知識面也不夠寬闊,所以只能系統的總結書中的要點,並根據自己的理解做些歸納。

主要內容

本書從多個方面圍繞高擴充套件性提出了50條建議,一個高擴充套件性的網站會隨著業務的發展、使用者的增加,自由的擴充套件架構,從而輕鬆的應付網站的快速發展。下面看看本書的具體內容:

化簡方程

1 不要過度的設計

過度的設計相當於給系統增加了複雜度與維護的成本。而這些過度的設計,在正常的使用中,卻沒有太大的作用。往往是設計者自己認為很重要或者錦上添花的功能,實際用處不大。

2 設計時考慮到擴充套件性

在設計時要遵循一下的設計原則:設計時考慮20倍的容量,實現時考慮3倍的容量,部署時考慮1.5的容量。一面專案擴大時,臨時擴充套件造成的困難。

3 把方案一簡再簡

應該遵循帕累托法則,20%的設計做了80%的工作,所以80%的時間,都應該放在這20%的設計上。

一個產品主要的功能其實都集中在幾個點上,把這幾個點設計好了,其他的都是些附加的功能而已。所以這核心的業務一定要保證足夠的簡潔易用。

4 減少DNS查詢

每個不同的域下的檔案,載入時都需要查詢DNS。比如cnblogs.com與i.cnblogs.com就屬於不同的域。那麼在查詢DNS的時候,就會查詢兩次。當業務量很大時,就會造成一定的影響。

5 儘可能減少物件

由於物件在瀏覽器訪問時,需要載入。所以可以考慮減少請求檔案的數量(數量與瀏覽器併發載入數有關),把一些物件儘量的合併。比如圖示類的檔案,可以合併成一個大的圖片。合理的檔案數量,會加速瀏覽器的訪問載入。

6 使用同一品牌的網路裝置

由於一個http請求,可能通過很多物理裝置。比如負載均衡器,交換機,路由器。所以儘量使用同一品牌的裝置,會避免一些意外的情況。

分佈工作

7 X軸,橫向複製

這種事最簡單的服務擴充,通過克隆或者複製實現,比如你的應用放在多個伺服器上進行服務。常見的比如叢集,負載均衡等等,資料庫的讀寫分離。

8 Y軸,拆分不同的東西

大型系統中,拆分不同的功能,比如註冊、購買、查詢、雲盤。等等

9 Z軸,拆分不同的相似的東西

比如按照使用者的級別,或者使用者的地理位置等等拆分。

橫向擴充套件設計

10 設計橫向的擴充套件方案

擴充套件包括橫向、縱向。橫向就是通過複製克隆應用,利用小型機叢集擴充套件。縱向就是提高伺服器的硬體以及網路設施。

通過很多的案例都可以發現,單純的升級硬體實現的縱向擴充套件,僅僅能解決一點點現實壓力。而通過橫向的叢集擴充套件,卻能夠自由的實現伸縮。

11 採用經濟型系統

與上面的原則類似,採用高價格的伺服器,並不能保證日後的良好效能。應該使用普通的小型機叢集擴充套件。

12 橫向擴充套件資料中心

資料中心有很多的設計方案,比如

熱冷站配置:使用熱站提供服務,當熱站崩潰時,使用冷站繼續服務。

推薦使用多個實時站點,成本更低,動態呼叫。缺點是增加了運維的難度。

13 利用雲技術進行設計

雲端計算的有點就是虛擬化,可以在業務峰值時,彈性的擴充裝置。並且在日常處理用,歸還該擴充套件。

缺點是提高了應用於虛擬環境的耦合。後面提到利用物理裝置,隔離業務,在虛擬化的雲端計算中,可能會對業務隔離錯誤排查造成一定的干擾。

使用正確的工具

14 合理使用資料庫

目前有許多的資料庫版本,比如傳統的關係型資料庫Oracle、MySQl,還有比較新的非關係型資料庫NoSql,比如MongoDB,以及記憶體資料庫FastDB,還有專門針對SSD固態硬碟的Aerospike等等。

但是到了選型的時候,還是要一句個人的業務需求來定。看你的資料庫要求的是速度,還是安全性等等。

15 防火牆,到處都是防火牆

防火牆可以對一些無效的訪問進行攔截過濾。通常把一些CSS,靜態檔案,圖片,JS等不採用防火牆,而關鍵的業務涉及到個人資訊時採用。合理的設計防火牆,也會對網站的效能產生一定的影響。

16 積極的利用日誌檔案

利用各種日誌以及工具,實時的監控業務。不僅僅是監控伺服器的記憶體CPU,還應該監控業務上的資料。比如splunk(提供日誌的蒐集,儲存,搜尋,圖形化展示)。

不要做重複的工作

17 不要立即檢查剛做過的工作

比如剛剛寫如了資料,不要立即讀取。雖然有些客戶需要保證資料的完整,不能丟失。但是可以通過日誌等記錄,寫完查這種做法,還是不推薦。

18 停止重定向

重定向會消耗一定的延遲,計算資源。應該儘量避免

19 放鬆時序約束

大多數的關係型資料庫講究ACID屬性,擴充套件時就造成一定的困擾。因此某些業務適當的放鬆時序約束,可以提高網站的效能。

比如某站在預定酒店時,使用者預定後,會等待酒店的稽核。比如某寶,在提款時,進行範圍時間的確認。這種就是擴大了時序約束,進而提高網站效能以及事務安全。

積極利用快取

20 利用CDN

可以利用CDN儲存客戶的資料和內容。大概的過程是,使用者在進行網站訪問時,轉到CDN的伺服器,CDN執行DNS查詢,把使用者請求分攤到不同的伺服器。有很多的CDN服務商提供這種服務。

21 使用過期頭

針對不同的物件型別,使用過期頭,減少物件請求。常見的HTTP對應屬性為:public no-cahe max-age等等

22 快取Ajax呼叫

正確修改Http頭Last-Modified Cache-Control Expires等屬性。

23 利用頁面快取

快取響應之前的冬天請求,降低web伺服器的負載。

24 利用應用快取

比如針對某些特殊的使用者,快取其請求資料。

25 利用物件快取

適用於反覆查詢使用的資料物件。比如一個購物網站,快取器熱銷產品資料。

26 把物件快取放在自己的層上

使用單獨的緩層,易於擴充套件和維護。

從錯誤中吸取教訓

27 積極的學習

一個公司有學習的氛圍,才會衍生出更好的產品。學習的內容一方面包括客戶的業務知識,一方面來自技術和運維領域。

28 不要依靠QA發現失誤

僱傭測試或者質量保證人員,最大的目的是為了檢測產品的正確性。它能減少成本,提高開發人員的開發速度,因為開發人員不需要時刻關注程式碼的正確性,可以交給QA來測試。

但是QA只負責發現問題,如何避免為題還是得依靠開發人員。

29 沒有回退的設計是失敗的設計

這裡的回退,指的是產品釋出的回退。如果碰上某些版本的BUG,可能需要交付之前可執行的版本,此時沒有回退,就無法交付產品了。

這裡推薦學習持續整合的相關內容。

30 討論失敗並從中吸取教訓

不應該在同一個問題上失敗兩次,每次失敗多進行總結是不可缺少的。

資料庫原則

關係型資料庫的ACID屬性:

原子性:一個事務要麼全執行,要麼都不執行,

一致性:事務開始和結束時,所有資料狀態要一致,

隔離性:事務的表現,是事務對資料庫唯一的操作,

永續性:事務完成,操作不能更改。

31 注意代價高的關係

應該在設計階段完善的設計表的結構,等開發開始時,在增加某些列,可能會花費很高的代價。

32 使用正確的資料庫鎖

資料庫有很多鎖的概念,比如隱式鎖、顯式鎖、行鎖、頁鎖、範圍鎖、表鎖、資料庫鎖等等。

不合理的使用鎖,會影響網站的吞吐量。

33 不要使用多階段提交

比如兩階段提交:先表決,在提交。這回降低擴充套件性,因為在其提交事務完成前,是不能作其他操作的。

34 不要使用select for update

因為FOR UPDATE從句會導致鎖定行,降低事務處理的速度。

35 不要選擇所有的資料

比如select * from xxx;

這種做法第一是不開與資料的擴充套件,比如本來有四列資料,業務處理程式碼直接寫死。當增加了一列資料時,就會導致出錯;另外就是會查詢出不必要的資料。

或者inset into xxx values(xxxx);

這是當列資訊不匹配時,也會出錯。

容錯設計與故障控制

36 採用隔離故障的”泳道“

服務與資料的劃分有很多種,比如容器,叢集,池,分片,泳道。泳道意味著每個業務有自己的領域,不能跨泳道呼叫。

37 不要信任單點故障

有很多系統設計成單點模式,當整個系統只是用該模組時,當出現單點故障,整個系統也就崩潰了。

38 避免系統串聯

比如一個系統有很多的元件組成,每個元件99.9%的安全性,當串聯3個元件時,整個系統的可用性就變成了99.7%。

39 確保能夠啟用/禁用功能

對於某些共享庫,第三方服務,應該提供開啟或者關閉的功能。

避免或分發狀態

40 努力實現無狀態

實現狀態會限制擴充套件性,增大成本

41 儘可能在瀏覽器端維護會話

一方面降低伺服器壓力,另一方面任何的請求可以傳送給任何的伺服器。

42 利用分散式快取存放狀態

使用獨立的快取層,利於擴充套件。有很多分散式的快取方案,比如memcached。

非同步通訊和訊息匯流排

43 儘可能使用非同步通訊

非同步通訊,可以確保每個服務和層之間的獨立性,這樣易於早呢更加系統的擴充套件性和減小耦合度。

44 確保訊息匯流排能夠擴充套件

儘量採用Y軸或者Z軸擴充套件,即按業務需求和功能擴充套件。因為單純的複製或者克隆,反而會增加各個訊息訂閱者的監聽數目。按照業務隔離,可以分離業務壓力。

45 避免讓訊息匯流排過度擁擠

衡量價值與訊息的成本。

其他原則

46 慎用第三方解決方案擴充套件

企業如果出現問題,那麼尋找第三方能夠解決燃眉之急。但是卻不是長久之計,因為解決方案的提供商有很多客戶,你的危機並不是他們的危機,所以不可能在關鍵時刻,盡職盡責。因此企業還是應該有一定的掌控力(這個詞真是高大上!)。

47 清除、歸檔和成本合理的儲存

有一些不必要的資料,就應該定期的刪除。一些略有價值的資料進行定期的歸檔直接刪除。一些很有價值的資料,應該進行備份以及快速訪問。

48 刪除事務處理中的商業智慧

應該把產品系統與業務系統分離,提高產品的擴充套件性。

避免業務擴充套件時,受到系統架構的限制。

49 設計能夠監控的應用

應該設計全域性的監控策略,保證回答

”發生了 問題了嗎?“

”哪裡發生了問題?“

”發生了什麼問題?“

”會發生問題嗎?“

”能自動修復嗎?“

50 要能勝任

應該在每個設計中涉及到最優秀的架構,不能完全依賴第三方的解決方案。

一個簡單優秀的架構,都是小而精的,如果單純的依靠開源解決架構,雖然解決了問題,卻會導致應用的臃腫。

參考

【1】《高擴充套件性網站的50條原則》

相關文章