無懼零下40~70攝氏度嚴苛環境,邊緣百變金剛是如何煉就的?

全球TMT發表於2022-12-19

北京 2022年12月19日 /美通社/ -- 計算是智慧時代一個永恆的話題。那邊廂雲端計算已是熱火朝天,這邊廂邊緣計算已呈燎原之勢。

有人形容,邊緣計算是“人工智慧的最後一公里”,“物聯網的最後一公里”,“打通使用者的最後一公里”……邊緣計算看似不起眼,卻將承載起邊緣側海量的資料計算處理。但“最後一公里”恰恰是最為艱難的一公里,需求的多樣化和差異化,讓邊緣計算產業化受到一定程度的制約。

如何打破這種局面,讓邊緣計算不再“邊緣”,在更多業務場景中加速走向落地?浪潮資訊的研發團隊走遍了大江南北,深入到海南太陽暴曬的路口、東北寒冷偏僻的油井現場、西北大山深處的煤礦等地進行多方位需求調研,提出邊緣伺服器要適應 零下 40~ 70攝氏度的嚴苛環境,並且創新性地發明了三明治散熱架構、低溫熱啟動裝置,大幅提升邊緣計算裝置環境適用性。

這些實踐無疑證明當前邊緣計算落地關鍵所在:即邊緣計算產品的研發與邊緣場景需求必須深入對接,既需要深入業務場景去了解真實需求,也要在產品研發上打破常規進行大膽創新,只有這樣方能真正引領邊緣計算走向落地。

上山下海,才敢提挑戰 零下 40~ 70攝氏度 極限

如今,在5G、大資料、AI、物聯網等技術的驅動下,邊緣場景在各大行業中迅速興起。Gartner預測,到2025年將有30%的資料會執行在邊緣,邊緣場景將會成為資料產生、智慧應用的主陣地之一。

與資料中心等相對穩定的環境和專業的運維團隊不同,邊緣場景的環境可謂是千差萬別,更沒有專業團隊負責日常的運維與管理,這就讓邊緣裝置的研發遇到兩大挑戰:其一,溫度、溼度、粉塵等環境因行業而異,不同行業的需求複雜多樣,對於邊緣裝置的適應性提出極高挑戰;其二,邊緣場景尚未成熟,有著巨大的需求空間尚待探索,使用者需求也不明確,廠商沒有標準來參考開發邊緣裝置與方案。

一切都需要以使用者為中心,去真實場景中探索詳細需求。例如,在室外一些智慧交通路口、智慧電網智慧運維等場景中,使用者對於裝置的環境適應性、執行穩定性要求很高。

針對邊緣計算裝置部署環境這個最大的挑戰,浪潮資訊的產品團隊大膽提出了“ 零下 40~ 70攝氏度”的部署環境溫度極限值。做出這個決定,產品團隊並不是拍腦門和想當然。從2020年浪潮資訊成立專門的邊緣計算事業部起,產品團隊在兩年時間裡進行了大量的使用者走訪與需求調研,得出“ 零下 40~ 70攝氏度”溫度極限值的產品研發需求。

但這卻給產品研發團隊提出了一個極大挑戰。因為一般環境限制,邊緣計算裝置會採用無風扇的設計,高溫散熱是極大考驗,“ 零下 40~ 70攝氏度”遠超市面其他產品的需求是在挑戰設計的極限。尤其是無風環境下要達到70 攝氏度,遠超一般通訊類裝置行業規範和標準。

但“ 零下 40~ 70攝氏度”極限值需求是使用者真實存在且必須滿足的,邊緣計算應用環境的複雜性超乎想象,邊緣計算技術要想獲得規模化地應用,就必須克服這個難題。

一塊三明治的啟發

眾所周知,散熱是邊緣計算裝置穩定執行的關鍵因素和最大難點。

這是因為如今的邊緣計算裝置早已不是簡單的執行控制程式,還需要進行大量的資料流處理、AI模型推理等,對於算力的需求大幅提升,也讓CPU的執行往往處於較為飽和的狀態,CPU一旦高速運轉,溫度最高可達90 攝氏度,加上像交通訊號櫃等邊緣場景往往是封閉的鐵皮箱,環境溫度在夏天往往達到60~70 攝氏度,讓邊緣計算裝置的散熱更加困難。

前期浪潮資訊研發方向致力於在散熱上蓋和熱源之間增加高導熱係數的導熱材料,讓熱量快速傳遞出去。但嘗試了很多次,連60 攝氏度的散熱極限的都無法滿足。

由於沒有行業內的先例可以參考,研發團隊對此只能重新根據需求,把關鍵點、矛盾點逐一列舉出來,利用思維導圖將問題點按照大小級別進行分類,以求尋找到關鍵的突破口。正當研發團隊再次陷入僵局,一塊加班中用來充飢的三明治引發了研發團隊的靈感。

三明治各種食材層層疊加的形狀,讓研發工程師們意識到可以借鑑到邊緣計算裝置的散熱上,散熱上蓋底部壓鑄出導熱凸臺,透過導熱凸臺與導熱介面材料、熱源部件依次貼合的結構,可以排出熱源上方的空氣,大大消除內部介面熱阻。

 “三明治”散熱架構就此誕生,散熱蓋、凸臺、介面材料、熱源從上到下就類似一塊三明治。不僅如此,研發團隊還針對邊緣伺服器百變的配置需求,設計了不同形狀上蓋,讓導熱凸臺、介面材料的位置、大小隨著內部器件的變化而變化,實現產品的靈活百變和高效散熱。

邊緣微伺服器三明治散熱架構
邊緣微伺服器三明治散熱架構

研發團隊前前後後做了七版方案,終於經過不斷努力,尋找到最為合理的方案。

有了整體的方案之後,接下來就是細心打磨、不斷最佳化的階段。例如,三明治的多層食材中,每一層食材的不同、食材的多少都會決定三明治的口感;同理,在“三明治”散熱架構中,每一層材料的區別是否也會帶來散熱效果的不同?為此,研發人員進行了仔細研究發現,介面材料厚度的微小差異,都會影響散熱的效率,材料厚度縮小0.6毫米,CPU的溫度就可以降低2.1 攝氏度。因此,研發團隊需要在CPU、記憶體等等部件凸臺最小結構公差下,設計出最小厚度的介面材料。

經過多次模擬和實測,研發人員最終採用高導熱和高壓縮性的介面材料和凸臺填充在熱源與散熱外殼之間,導熱效率達到10W/m·K,是空氣導熱效率的435倍,讓伺服器適應的極限環溫從原來的60 攝氏度提升到67 攝氏度

67 攝氏度已經超越了很多邊緣裝置的極限值,但這還不夠,離最終需求還差3 攝氏度。真所謂行百里者半九十,最後這3 攝氏度最為接近極限需求,那麼,還能有繼續最佳化的空間麼?其實,把CPU散熱這個最大難點解決了,等於大幅提升了內部熱傳導效率,相當於成功了一大半。接下來,可以從邊緣計算裝置整體散熱的角度去最佳化考慮,從機箱結構、每個部件等方面做到最優。”

為此,研發團隊從“裝置與環境之間如何進行高效導熱”的角度出發,利用熱模擬軟體對多組引數組合進行對比分析,並繪製響應面最佳化曲線,最終確定出一組關於鰭片厚度、間隙和高度的最優組合,在有限體積內形成超過3000平方釐米的散熱面積,達到了最佳散熱能力。同時,為了進一步讓上蓋均勻的將熱量擴散出去,消除區域性熱點,散熱上蓋中設計了2D熱管網路,熱管走向經過反覆最佳化模擬,精準佈局,有效規避區域性熱點的產生,提升整機均溫能力。

終於,浪潮邊緣微伺服器EIS 800這臺能夠在無風條件下、70 攝氏度極限環境也能高效、穩定執行的邊緣計算裝置橫空出世。

浪潮邊緣微伺服器EIS 800已經獲得2022年度德國紅點設計大獎,並且在製造、交通、能源、水利、零售等多個行業使用者的環境中透過了POC驗證,未來將在各個邊緣場景中發揮重要作用,進一步推動邊緣計算產業走向落地。

模組化設計應需而變:一切為了邊緣計算

邊緣計算裝置的產品設計與規劃,並不會圍繞某個部件的迭代而展開,而是會從實際需求的角度進行迭代。

不過,邊緣場景需求的差異化、多樣化,的確又是橫跨在邊緣計算裝置走向規模化的一大難題。差異化和多樣化意味著大量需求彼此互斥,需要單獨設計,產品通用性差,後期的維護、保障也會遇到各種問題。如何改變這種局面,真正讓邊緣計算走向落地?

在經歷了大量調研和反覆論證之後,浪潮資訊提出瞭解耦模組化設計的思路。這種思路類似樂高搭積木,形成核心計算模組、AI模組、通訊模組、管理模組、散熱模組等核心模組,統一不同模組的介面標準,再根據邊緣場景的差異化需求進行拆解和組合,靈活滿足不同邊緣場景的產品需求。

邊緣模組化設計架構ECOM
邊緣模組化設計架構ECOM

例如,智慧路口場景中,攝像頭從幾路到十幾路,邊緣計算裝置的算力需要階梯式佈局;又如,在工業場景,需要更加靈活的通訊方式,需要相容有和無線不同網路通訊;而針對油井、礦山等環境會出現的邊緣裝置低溫啟動難的問題,浪潮資訊研發團隊還為系統設計了遠端運維模組,低溫熱啟動裝置,可以在環境溫度 零下40 攝氏度的環境下,遠端或自動調動系統來加熱邊緣計算裝置,讓裝置每部每個元件滿足溫度要求後再啟動執行。

從模組元件解耦到根據需求進行靈活組合,既考驗邊緣裝置研發團隊的整體設計能力,又對於模組之間組合後的產品效果提出挑戰。為此,浪潮資訊不斷摸索,推出了邊緣模組化設計架構ECOM(Edge Computing Optional Module),並且對各個模組之間通訊進行最佳化。目前,浪潮資訊已經將邊緣計算模組化設計標準ECOM貢獻給全球開放計算組織ODCC。

與傳統伺服器清晰統一的設計方式、理念不同,邊緣計算依然處於探索期,更加需要有意識地去完善標準,從而更好地推動落地。

星空不問趕路人,歲月不負有心人。作為中國邊緣伺服器市場第一的廠商,浪潮資訊會持續以客戶為中心,貼近使用者場景需求,攜手生態夥伴共同推動邊緣計算加速落地。


來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/70004007/viewspace-2928654/,如需轉載,請註明出處,否則將追究法律責任。

相關文章