虛擬化Pod效能比裸機還要好,原因竟然是這樣!
題圖攝於頤和園:雪後初晴佛香閣
之前的文章介紹過 VMware 在 VMworld 上宣佈的太平洋專案 (Project Pacific) ,這是 vSphere 向 Kubernetes 原生平臺的演進。太平洋專案引入了 vSphere 主管叢集( Supervisor Cluster )的概念,該叢集能夠在 ESXi 上原生地執行 Kubernetes Pod(稱為 Native Pod )。
根據 VMware 官博上釋出的資訊,太平洋專案中透過虛擬化實現的 Native Pods,竟然比物理機(裸機)上 Kubernetes 的 pod 有8%的效能提升!
是的,你的確沒有看錯,虛擬化 Pod 的效能要比裸機 Pod 要好,這似乎有悖常理,眾所周知,虛擬化是有效能損失的,怎能優於裸機呢?且聽筆者慢慢道來。
為什麼太平洋專案的 Native Pods 更快?
現代的伺服器一般有多個處理器(CPU),採用的是 NUMA(非統一記憶體訪問)的記憶體訪問方式。在 NUMA 體系架構中,每個 CPU 負責管理一塊記憶體,稱為本地(local)記憶體。
當 CPU 訪問自己管理的記憶體時,因為是就近訪問,速度比較快;但如果需要訪問其它 CPU 名下的記憶體時(稱為遠端訪問),往往需要經過若干個電路開關,通常會慢一些。
ESXi 在排程 Pod 的時候,考慮到了 Pod 使用記憶體的本地性(locality),會確保其儘量訪問本地記憶體,這樣 Pod 執行效能比較好,並提高總體 CPU 效率。另一方面,裸機 Linux 中的程式排程程式可能無法在 NUMA 域之間提供類似的功能,因此效能有一定的損失。
ESXi CPU 排程程式知道 Pod 是獨立的執行實體,因此會盡量確保其記憶體訪問位於本地 NUMA 域內,大大減少了遠端記憶體訪問的次數,從而為 Pod 中的工作負載提供更好的效能,並提高 CPU 總體效率。另一方面,Linux 中的程式排程程式無法較好地識別 NUMA 域之間差異,所以不能提供類似的排程能力。
太平洋專案 Native Pods 的效能評估實驗
為了比較效能,VMware 的工程師在相同的硬體上配置了圖1所示的測試平臺,每臺伺服器硬體是 2.2 GHz 的核心 44 個以及 512 GB 記憶體:
a) 兩個太平洋專案的ESXi節點和其上的主管叢集
b) 兩個預設配置的某主流企業級 Linux 裸機叢集節點
圖1:測試平臺配置
通常,超執行緒處理器核心具有多個邏輯核心(超執行緒),它們之間共享硬體資源。為了減少對測試影響的因素,在兩個測試平臺中都禁用了超執行緒。在每個叢集中,使用其中一個節點作為被測系統(Worker Node),而在另一個節點上執行 Kubernetes Master 。
圖2:Pod配置
在 Worker 節點中部署了10個 Kubernetes Pod,每個 Pod 的資源限制為 8個CPU,42 GB 記憶體,並在每個容器中執行一個標準 Java 事務基準測試,如圖2所示。
考慮到用於我們的工作負載的複雜性和性質,在實驗中使用了較大的 Pod ,以便管理測試樣例執行和 Pod 的評分彙總。使用 Pod 定義將 Pod 固定(affinitized)到每個測試平臺中的 Worker節點。使用所有10個 Pod 的彙總分數(最大吞吐量)來評估被測系統的效能。測試中基本沒有設計I / O或網路傳輸,並且所有實驗都限於單個 Kubernetes節點。因此,I / O或網路效能方面的影響不在本文中討論。
測試結果
圖3顯示了某主流企業級 Linux 裸機節點的效能和太平洋主管群集的效能(綠色條)對比,裸機 Linux 的效能作為基準1.0。
與裸機企業級 Linux 相比,太平洋主管群集的效能提高了8%。
圖3:太平洋主管叢集與裸機企業級Linux節點相對效能
測試重複了多次並用平均數減少了實驗的誤差。與裸機情況相比,太平洋主管群集可實現約8%的總體效能提升。
分析和最佳化
檢視系統統計資訊,與 vSphere 主管叢集相比,裸機上執行的工作負載被許多遠端 NUMA 記憶體訪問拖累了效能。vSphere 主管群集的效能優勢主要來自更優的CPU排程方法,同時還抵扣掉因虛擬化帶來的效能額外開銷。
進一步分析發現,在裸機 Linux 中,只有約43.5%的非命中L3快取記憶體的資料可從本地 DRAM 中獲取,其餘的則需要由遠端記憶體提供。相比之下,vSphere 主管群集得益於ESXi中出色的 CPU 排程功能,有 99.2%的未命中 L3 資料可在本地 DRAM中獲得,從而避免了遠端記憶體訪問,提高了vSphere主管群集的效能。(如圖4所示)
圖4:vSphere 主管群集與裸機 Linux上的 DRAM 命中率對比(數值越大越好)
為了減少裸機 Linux上非本地 NUMA 訪問對效能的影響,工程師們嘗試了一些基本的最佳化,例如切換 NUMA 平衡開關和使用基於任務集的Pod固定到 CPU,但是這些都沒有實質性地提高效能。目前 Kubernetes 沒有對 NUMA 架構的 CPU 使用納入 Pod 規範,因此暫時沒有教好的方法解決這個問題。
在本實驗的結論取決於Pod訪問記憶體的密集度情況,如果工作負載具有不同的記憶體需求,則 NUMA 本地性對其效能的影響可能會有所不同。簡而言之,對記憶體訪問頻率高的 Pod 應用,跑在 vSphere 主管群集上可能比裸機上效能更好。
更多資訊,參見:
https://blogs.vmware.com/performance/2019/10/how-does-project-pacific-deliver-8-better-performance-than-bare-metal.html
來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/31557890/viewspace-2677359/,如需轉載,請註明出處,否則將追究法律責任。
相關文章
- 邊緣計算工作負載:虛擬機器,容器還是裸機?負載虛擬機
- 千萬不要“教”孩子畫畫,原因竟然是這樣
- 沙盒化容器:是容器還是虛擬機器虛擬機
- WPF效能最佳化之UI虛擬化UI
- 虛擬dom優化效能的表現優化
- seo新手優化網站效果不明顯,竟然是這個原因!看完這個就懂了優化網站
- 這屆日本年輕人竟然是這樣的
- 虛擬機器去虛擬化過魯大師教程虛擬機
- 路由器你竟然是這樣的...路由器
- 虛擬化環境下的效能測試
- PD虛擬機器好用還是 Virtualbox好用虛擬機
- C 語言寫得比 Codex 還要好的 AI 開源了!AI
- 深入理解虛擬機器之虛擬機器效能監控和故障處理工具虛擬機
- Dalvik虛擬機器、Java虛擬機器與ART虛擬機器虛擬機Java
- 伺服器物理機使用ESXI虛擬化並劃分虛擬機器伺服器虛擬機
- VMware虛擬機器優化,提高虛擬機器執行速度的方法?虛擬機優化
- 虛擬化四、KVM虛擬化技術
- 虛擬主機網站404報錯是什麼原因網站
- [譯] React效能優化-虛擬Dom原理淺析React優化
- 虛擬機器未知原因丟失的資料恢復案例虛擬機資料恢復
- 虛擬化技術之kvm虛擬機器建立工具virt-install虛擬機
- 虛擬化技術之kvm虛擬機器建立工具qemu-kvm虛擬機
- 銀行雲原生基礎設施構建:裸金屬VS虛擬機器虛擬機
- java虛擬機器和Dalvik虛擬機器Java虛擬機
- Android 虛擬機器 Vs Java 虛擬機器Android虛擬機Java
- 使用DiskGenius工具來實現物理機遷移虛擬機器,實現虛擬化虛擬機
- 雲端自動化虛擬機器虛擬機
- 虛擬辦公、虛擬展會、虛擬偶像,RTE+XR 還能做什麼?
- 虛擬偶像的歌聲原來是這樣生成的!
- Linux 判定伺服器為物理機還是虛擬機器Linux伺服器虛擬機
- 虛擬列表是怎麼做效能最佳化的?
- 【虛擬機器資料恢復】EXSI虛擬機器誤還原快照的資料恢復案例虛擬機資料恢復
- Win10怎樣開啟VT虛擬化 win10開啟VT虛擬化的步驟Win10
- Docker是否比虛擬機器更適合我們?Docker虛擬機
- 虛擬機器效能監控和故障處理工具虛擬機
- win10 自帶虛擬機器怎樣開啟_win10自帶虛擬機器在哪Win10虛擬機
- 部落格網站怎樣選擇虛擬主機網站
- 深入理解 python 虛擬機器:原來虛擬機器是這麼實現閉包的Python虛擬機