讓 CPU 告訴你硬碟和網路到底有多慢
點選上方“芋道原始碼”,選擇“設為星標”
做積極的人,而不是積極廢人!
原始碼精品專欄
來源:http://t.cn/Etv1t5u
簡介
資料
參考資料
簡介
經常聽到有人說磁碟很慢、網路很卡,這都是站在人類的感知維度去表述的,比如拷貝一個檔案到硬碟需要幾分鐘到幾十分鐘,夠我去吃個飯啦;而從網路下載一部電影,有時候需要幾個小時,我都可以睡一覺了。
最為我們熟知的關於計算機不同元件速度差異的圖表,是下面這種金字塔形式:越往上速度越快,容量越小,而價格越高。這張圖只是給了我們一個直觀地感覺,並沒有對各個速度和效能做出量化的說明和解釋。而實際上,不同層級之間的差異要比這張圖大的多。這篇文章就讓你站在 CPU 的角度看這個世界,說說到底它們有多慢。
希望你看到看完這篇文章能明白兩件事情:磁碟和網路真的很慢,效能優化是個複雜的系統性的活。
注:所有的資料都是來自這個地址。所有的資料會因為機器配置不同,或者硬體的更新而有出入,但是不影響我們直覺的感受。如果對這些資料比較感興趣,這個網址給出了不同年份一些指標的數值。
資料
先來看看 CPU 的速度,就拿我的電腦來說,主頻是 2.6G,也就是說每秒可以執行
2.6*10^9
個指令,每個指令只需要0.38ns
(現在很多個人計算機的主頻要比這個高,配置比較高的能達到 3.0G+)。我們把這個時間當做基本單位1s
,因為1s
大概是人類能感知的最小時間單位。
一級快取讀取時間為
0.5ns
,換算成人類時間大約是1.3s
,大約一次或者兩次心跳的時間。這裡能看出快取的重要性,因為它的速度可以趕上 CPU,程式本身的 locality 特性加上指令層級上的優化,cache 訪問的命中率很高,這最終能極大提高效率。分支預測錯誤需要耗時
5ns
,換算成人類時間大約是13s
,這個就有點久了,所以你會看到很多文章分析如何優化程式碼來降低分支預測的機率,比如這個得分非常高的 stackoverflow 問題。二級快取時間就比較久了,大約在
7ns
,換算成人類時間大約是18.2s
,可以看到的是如果一級快取沒有命中,然後去二級快取讀取資料,時間差了一個數量級。
小知識:為什麼需要多層的 CPU 快取呢?這篇文章通過一個通俗易懂的例子給出了講解。
我們繼續,互斥鎖的加鎖和解鎖時間需要
25ns
,換算成人類時間大約是65s
,首次達到了一分鐘。併發程式設計中,我們經常聽說鎖是一個很耗時的東西,因為在微波爐里加熱一個東西需要一分鐘的話,你要在那傻傻地等蠻久了。然後就到了記憶體,每次記憶體定址需要
100ns
,換算成人類時間是260s
,也就是4分多鐘
,如果讀一些不需要太多思考的文章,這麼久能讀完2-3千字(這個快閱讀的時代,很少人在手機上能靜心多這麼字了)。看起來還不算壞,不多要從記憶體中讀取一段資料需要的時間會更多。到了記憶體之後,時間就變了一個量級,CPU 和記憶體之間的速度瓶頸被稱為馮諾依曼瓶頸。一次 CPU 上下文切換(系統呼叫)需要大約
1500ns
,也就是1.5us
(這個數字參考了這篇文章,採用的是單核 CPU 執行緒平均時間),換算成人類時間大約是65分鐘
,嗯,也就是一個小時。我們也知道上下文切換是很耗時的行為,畢竟每次浪費一個小時,也很讓人有罪惡感的。上下文切換更恐怖的事情在於,這段時間裡 CPU 沒有做任何有用的計算,只是切換了兩個不同程式的暫存器和記憶體狀態;而且這個過程還破壞了快取,讓後續的計算更加耗時。在 1Gbps 的網路上傳輸 2K 的資料需要
20us
,換算成人類時間是14.4小時
,這麼久都能把《星球大戰》六部曲看完了(甚至還加上吃飯撒尿的時間)!可以看到網路上非常少資料傳輸對於 CPU 來說,已經很漫長。而且這裡的時間還是理論最大值,實際過程還要更慢一些。SSD 隨機讀取耗時為
150us
,換算成人類時間大約是4.5天
。換句話說,SSD 讀點資料,CPU 都能休假,報團參加周邊遊了。雖然我們知道 SSD 要比機械硬碟快很多,但是這個速度對於 CPU 來說也是像烏龜一樣。I/O 裝置
從硬碟開始速度開始變得漫長,這個時候我們就想起記憶體的好處了。儘量減少 IO 裝置的讀寫,把最常用的資料放到記憶體中作為快取是所有程式的通識。像memcached
和redis
這樣的快取記憶體系統近幾年的異軍突起,就是解決了這裡的問題。從記憶體中讀取
1MB
的連續資料,耗時大約為250us
,換算成人類時間是7.5天
,這次假期升級到國慶七天國外遊了。同一個資料中心網路上跑一個來回需要
0.5ms
,換算成人類時間大約是15天
,也就是半個月的時間。如果你的程式有段程式碼需要和資料中心的其他伺服器互動,在這段時間裡 CPU 都已經狂做了半個月的運算。減少不同服務元件的網路請求,是效能優化的一大課題。從 SSD 讀取 1MB 的順序資料,大約需要
1ms
,換算成人類時間是1個月
。也就是說 SSD 讀一個普通的檔案,如果要等你做完,CPU 一個月時間就荒廢了。儘管如此,SSD 已經很快啦,不信你看下面機械磁碟的表現。磁碟定址時間為
10ms
,換算成人類時間是10個月
,剛好夠人類創造一個新的生命了。如果 CPU 需要讓磁碟泡杯咖啡,在它眼裡,磁碟去生了個孩子,回來告訴它你讓我泡的咖啡好了。機械硬碟使用RPM(Revolutions Per Minute/每分鐘轉速)
來評估磁碟的效能:RPM 越大,平均定址時間更短,磁碟效能越好。定址只是把磁頭移動到正確的磁軌上,然後才能讀取指定扇區的內容。換句話說,定址雖然很浪費時間,但其實它並沒有辦任何的正事(讀取磁碟內容)。從磁碟讀取 1MB 連續資料需要
20ms
,換算成人類時間是20個月
。IO 裝置是計算機系統的瓶頸,希望讀到這裡你能更深切地理解這句話!如果還不理解,不妨想想你在網上買的東西,快遞送了將近兩年,你的心情是怎麼樣的。而從世界上不同城市網路上走一個來回,平均需要
150ms
(參考世界各地 ping 報文的時間),換算成人類時間是12.5年
。不難理解,所有的程式和架構都會盡量避免不同城市甚至是跨國家的網路訪問,CDN 就是這個問題的一個解決方案:讓使用者和最接近自己的伺服器互動,從而減少網路上報文的傳輸時間。虛擬機器重啟一次大約要
4s
時間,換算成人類的時間是3百多年
。對於此,我想到了賈伯斯要死命優化 Mac 系統開機啟動時間的故事。如果機器能少重啟而且每次啟動能快一點,不僅能救人命,也能救 CPU 的命。物理伺服器重啟一次需要
5min
,換算成人類時間是2萬5千年
,快趕上人類的文明史了。5 分鐘人類都要等一會了,更別提 CPU 了,所以沒事不要亂重啟伺服器啊,分分鐘終結一個文明的節奏。
參考資料
What Every Programmer Should Know About Memory
Getting Physical With Memory
歡迎加入我的知識星球,一起探討架構,交流原始碼。加入方式,長按下方二維碼噢:
已在知識星球更新原始碼解析如下:
如果你喜歡這篇文章,喜歡,轉發。
生活很美好,明天見(。・ω・。)ノ♡
相關文章
- JavaScript 到底有多慢?JavaScript
- 網際網路之父告訴你為什麼網路中立很重要
- 讓機器學習告訴你,你的siri在想什麼!機器學習
- 讓老媽告訴你如何程式設計程式設計
- 10年網際網路開發者告訴你自學 Java 怎麼入門?Java
- 告訴你一個真實的中國網際網路:精英與草根
- 從技術角度告訴你,區塊鏈到底有哪些特點和運作機制區塊鏈
- 程式猿,讓我來告訴你怎麼追女生!!!
- 一文告訴你Java日期時間API到底有多爛JavaAPI
- 網際網路廣告投哪了?adbug廣告搜尋告訴你
- 十張圖告訴你網際網路發展的八大趨勢
- 固態硬碟知識點一篇文章都告訴你!硬碟
- NLP(十五)讓模型來告訴你文字中的時間模型
- 什麼是「小島秀夫遊戲」?讓監督親自告訴你遊戲
- 讓 APISpace 告訴你什麼場景使用什麼APIAPI
- 馬雲王牌軍用40張PPT告訴你什麼是網際網路金融
- 國產固態硬碟該怎麼選?MLC和TLC的差距大嗎?宏旺半導體告訴你硬碟
- 29張PPT告訴你移動網際網路是如何吃掉整個世界的
- 十張圖告訴你網際網路發展的八大趨勢——資訊圖
- 大資料告訴你,中國網際網路到底發展成什麼樣了大資料
- 讓我來告訴你為什麼做女程式媛很好
- 神經網路是怎麼“看”東西的?啟用圖告訴你神經網路
- 面試完總是讓你回去等通知?不,告訴你怎麼搶救下!面試
- 網站安全公司告訴你網站為何會被黑網站
- 周朝陽:一件小事告訴你,網際網路免費江湖早已結束了
- 索尼PS VR究竟有多火?讓搜尋資料告訴你VR
- 網路硬碟硬碟
- 2017網路主播新風尚:4500多位主播告訴你的直播真相
- ping 命令你真的會了嘛?網路高手告訴你如何玩的更 6!!!
- 萬兆網路卡該如何選擇?我來告訴你!
- 太慢不能忍!CPU又拿硬碟和網路卡開刀了!硬碟
- 2021年國慶你的朋友去哪浪了?讓Python告訴你!Python
- 怎樣讓你的YouTube影片更吸引人——Movavi Video Editor for Mac告訴你IDEMac
- [AI開發]零數學公式告訴你什麼是(卷積)神經網路AI公式卷積神經網路
- 一篇文章告訴你:“12306”的架構到底有多牛逼?架構
- 三個數字告訴你:傳統電視已死,網際網路電視受歡迎
- 11條理由告訴你,為什麼你的網站不賣座網站
- 一圖告訴你 iOS 6 和 iOS 7 的區別iOS