程式設計師要搞明白CDN,這篇應該夠了

1點25發表於2019-07-17

最近在瞭解邊緣計算,發現我們經常聽說的CDN也是邊緣計算裡的一部分。那麼說到CDN,好像只知道它中文叫做內容分發網路。那麼具體CDN的原理是什麼?能夠為使用者在瀏覽網站時帶來什麼好處呢?解決這兩個問題是本文的目的。

CDN概念

CDN全稱叫做“Content Delivery Network”,中文叫內容分發網路

實際上CDN這個概念是在1996年由美國麻省理工學院的一個研究小組為改善網際網路的服務質量而提出的。那麼它到底是怎麼改善網際網路服務質量的呢?

原理分析

我們知道,當我們使用域名訪問某一個網站時,實際上就是將請求包(以Http請求為例)通過網路傳輸給某臺伺服器,比如訪問“www.baidu.com”時:

  1. 首先解析出該域名所對應的IP地址(DNS域名解析)
  2. 然後將Http請求包通過網路路由到IP地址所對應的伺服器

我們通常說“伺服器的IP地址”,這其實不太準確,IP地址是和網路卡繫結的,一個伺服器可以有多個網路卡,也就是可能有多個IP地址。

我們先來看第一步:域名解析

域名解析

解析域名分為兩種:

  1. 將一個域名解析為一個IP地址
  2. 將一個域名解析為另外一個域名

其實解析思路不難,我們在域名服務商購買了一個域名之後,需要去對映一個IP地址,可以用Map來表示這個關係:{域名:IP}

同時我們也可以給某個域名取一個別名,比如“www.baidu.com”取一個別名“test.baidu.com”,這種關係也可以用Map來表示:{域名:別名}。這裡的別名專業一點叫做CNAME,相信大家對這個詞有點眼熟,它就是這個意思。

域名解析,實際上就是解析出指定域名所對應的IP地址,或者該域名的一個CNAME。

而域名解析是由DNS系統來負責的,DNS服務接受外部請求,從請求裡提取域名,

  • 如果這個域名對應的是IP地址,則返回這個IP地址,
  • 如果這個域名對應的是CNAME,則繼續查詢CNAME域名的IP地址,然後將該地址返回給請求傳送者。

請求傳送者拿到IP地址之後,完成真正的請求呼叫。

實際上DNS系統是非常龐大的,這裡不去多將,大家把它當作一個黑盒子,這個盒子的作用就是上文所描述的,這裡用一個簡單的圖來表示一下。

沒有CNAME的情況:
image.png

有CNAME的情況:
image.png

特別注意:在有CNAME的情況下,我們可以發現,CNAME實際上在域名解析的過程中承擔了中間人(或者說代理)的角色,這是CDN實現的關鍵。

CDN原理

首先CDN是為了改善網際網路的服務質量通俗一點說其實就是提高訪問速度。

假設百度網站現在只有一臺伺服器,現在有一個人在上海訪問百度,如果該伺服器也在上海,那麼通常來說訪問比較快,如果該伺服器在拉薩,那麼相對而言訪問就比較慢了。那麼這個問題的根本原因是網路傳輸是依賴於網線的,網線越長,那麼時間肯定就越久。

那麼怎麼解決這個問題呢?其實思路很簡單,百度在全國各地都部署一模一樣的伺服器就行了,專業一點叫冗餘。

思路很簡單,但實現還是比較麻煩的,伺服器上的資源分為兩種:靜態資源動態資源

  • 靜態資源:這種資源通常是很少變動的,比如圖片,視訊,css,javascript等等
  • 動態資源:這種資源不同使用者不同時刻訪問通常是不一樣的,比如ftl,jsp等等。

那麼如果百度要在全國各地都部署伺服器,如果說每個伺服器上都有相同的動態資源,那麼可能還需要配置相應的資料庫,因為動態資源所記錄的資訊通常會儲存在資料庫中,那麼這就涉及到了資料同步等等問題,這會導致成本很高,這種做法專業一點其實就是叢集,而目前來說叢集架構最多是三地五中心,不是說全國多地叢集不可能,主要是成本太高。

大家想了解三地五中心的,可以看https://mp.weixin.qq.com/s/uGyGldbwmShDDPDau5pAPw這篇文章,也是本人寫的。

那麼有沒有成本比較低的方式呢,有,就是在每個伺服器上只部署靜態資源,靜態資源通常不涉及到資料庫,所以成本也比較低,而且也能提高使用者的訪問速度。

到這裡,介紹了CDN想要達到的目的,那麼怎麼達到這個目的呢?

現在如果要比較CDN系統,我們可以考慮兩點:

  1. CDN系統中儲存靜態資源伺服器的效能以及網速怎麼樣。
  2. CDN系統中全國甚至全球範圍內伺服器節點的數量以及部署情況。

第一點很好理解,第二點大家應該也能理解了,如果靜態資源的伺服器節點很多,能夠讓每個使用者在訪問這些靜態資源時都不用“跑很遠的路程”才能獲取到,那麼自然這是CDN系統的優點。

有公司看到了這種需求,所以現在其實有很多CDN供應商,比如阿里,騰訊等等都有自己的CDN服務。只要你自己的系統接入了這些大廠所提供的CDN服務,你把自己的靜態資源傳給CDN服務,那麼這些靜態資源將自動的分佈到全世界各地去。

好,那麼現在的問題是,使用者在訪問靜態資源時也是通過域名來訪問的,域名會被解析成某一個IP地址,關鍵的問題就是,DNS系統怎麼在做域名解析時,解析出來一個離使用者最近的一個IP地址呢

普通的DNS系統是做不到的,需要一個特殊的DNS伺服器,這個特殊DNS需要知道

  1. 使用者當前所在位置
  2. 還需要知道使用者現在訪問的這個域名對應哪些IP地址,以及這個IP地址分別在哪?

對於第一個問題好解決,直接從使用者請求裡提取出使用者的ip地址,比如這個ip地址被解析為北京電信、上海移動等等。

第二個問題由誰來解決,我們現在考慮的是CDN,CDN提供商肯定知道他們公司在哪些地方部署了機器以及它們的IP地址,所以這個問題只能有CDN提供商來解決,CDN提供商會提供這個特殊的DNS伺服器,我們叫做 CDN專用DNS伺服器

這樣的話,只要使用者在使用某個域名訪問靜態資源時,如果使用者直接配置自己電腦的DNS地址為CDN專用DNS伺服器。那麼自然解決了問題,但是我們需要考慮的時,我們不能要求世界上所有的使用者都去修改自己電腦的DNS地址。所以這個時候就要利用DNS中的CNAME了。

使用者使用某個域名來訪問靜態資源時(這個域名在阿里CDN服務中叫做“加速域名”),比如這個域名為“image.baidu.com”,它對應一個CNAME,叫做“cdn.ali.com”,那麼普通DNS伺服器(區別CDN專用DNS伺服器)在解析“image.baidu.com”時,會先解析成“cdn.ali.com”,普通DNS伺服器發現該域名對應的也是一個DNS伺服器,那麼會將域名解析工作轉交給該DNS伺服器,該DNS伺服器就是CDN專用DNS伺服器。CDN專用DNS伺服器對“cdn.ali.com”進行解析,然後依據伺服器上記錄的所有CDN伺服器地址資訊,選出一個離使用者最近的一個CDN伺服器地址,並返回給使用者,使用者即可訪問離自己最近的一臺CDN伺服器了。

image.png

總結

通過上面的文章我們可以發現,CDN的實現原理依賴於DNS,因為本人不是專門搞網路的,所以文中如果有不準確的地方,還請各位大佬指出。

重點
****有痛點才有創新,一個技術肯定都是為了解決某個痛點才出現的。
請幫忙轉發一下,如果想第一時間學習更多的精彩的內容,請關注微信公眾號:
1點25**
reny125.jpeg

相關文章