從網路發展看無線網路故障排查需求

佚名發表於2016-11-29

  一、當最後100米無線化

  所有對網路故障維護有較長期經驗的人都清楚,早期網路大概75%左右的故障來自於物理連線故障,也就是來自於網線或物理介面。後期伴隨綜合佈線理念的貫徹與執行,製造工藝的提升,線纜與介面質量的提升,這一故障的比例大幅度降低了。那麼當我們的最後100米無線化之後,網線和物理介面會出現什麼樣的情況呢?

  1.1 靈活性的大躍進與技術本身的退步

  首先我們應該有一個明確的認識,無線WLAN網路事實上是網路靈活性的提升和網路技術的倒退。從技術角度講,WLAN本身將網路技術倒退了至少5-10年,即從交換式乙太網年代退回到共享式乙太網年代。這種倒退從物理介質角度而言尤甚,因為在當前的交換式乙太網技術中,每個使用者是獨享傳輸介質的,但是在無線技術中,所有的使用者共享物理通道,只要使用者間相互可見,無論有多少個AP,所有工作在同一頻點的使用者共享相同的物理介質。這就是典型的同軸共享式乙太網或基於HUB的共享式乙太網的特徵。

  那麼在共享式乙太網裡需要考慮的物理資料碰撞、網路使用者量與資料量規模無法無限擴充套件等問題重新歸來,因此網路排錯時需要考慮的因素增加了。

  1.2 便捷性與管理複雜度的雙重提升

  相較乙太網,WLAN在提升便捷性的同時,其傳輸介質發生了明顯的變化,從現在幾乎絕對可信的銅纜和光纖變為絕對不可信的頻譜資源,因此,管理無線網路的網管人員除必須擁有管理乙太網路必備的充足TCP/IP知識外,還必須理解無線網路中的射頻知識,例如對訊雜比、訊號強度、發射功率、天線增益、干擾等概念的真正理解,以及對802.11協議的獨特特性,例如重傳的概念的真正理解。管理無線網路對網管員的知識體系提出了新的挑戰,並且對接入介質的管理複雜度呈幾何級提升。

  1.3 從管理“有”到管理“無”

  傳統乙太網是有線網路,所有的連線是可見的,某個終端連線到具體哪個裝置是明確的。而無線網路的連線是不可見的,某個終端在整個的接入過程中會不斷的發生切換,從一個接入裝置切換到另外一個接入裝置。在某些極端情況下,裝置會在兩個不同的接入AP之間一分鐘之內切換幾十甚至上百次,並且這種切換完全由客戶端決定,傳統網管軟體的重新整理速率已經完全無法把握這種情況,這無疑成為如何進行無線網路管理所需解決的又一個重點問題。

  二、摩托羅拉系統將無線故障排查視覺化

  2.1 無線網路拓撲的視覺化

  不一樣的無線網路拓撲。當討論有線網路拓撲圖時,我們只需將客戶端簡單地連線到接入交換機的物理介面即可。但是在無線裡同一個AP還需要討論其ESS/BSS的問題,因此拓撲圖應該是客戶端接入了哪一個BSS,然後這個BSS接入到哪一個ESS。所以,無線網路的拓撲圖與有線網路的拓撲圖是完全不同的。

從網路發展看無線網路故障排查需求三聯

  2.2 不同的物理狀態

  在無線領域中,沒有明確的線纜連線,只有無線區域的覆蓋好壞,而且無線網路的動態特徵導致這種覆蓋好壞是變化的。因此,我們需要實時熱圖來監控整個無線網路,使其真正的可視起來。

無線網路

  2.3 物理層排錯

  在物理層排錯時,大家普遍認為無線的干擾是網路質量的罪魁禍首。但是事實上,無線網路中的資源利用率和干擾強度的組合才是真正的問題所在,而且干擾不僅僅是WLAN對WLAN的干擾,還包括其它同頻干擾,例如微波、2.4GHz無線電遙控射頻訊號或者藍芽訊號。因此,在物理層排錯中,我們必須對所有的干擾源進行分析,同時對其資源利用率進行監控。僅僅通過網上某些免費的工具是不能夠真正定位問題所在的。

  舉一個簡單的例子,大家隨便找兩個AP,將其設定在同一個通道上,然後把它們的發射功率調到最大,物理間隔僅10釐米。用傳統軟體看,這種干擾是極強的。但是如果有一個AP上有使用者,另外一個AP上一個使用者都沒有,或者即使兩個AP都有使用者,在AP的競爭策略設定合理、使用者流量不大的情況下,我們的上網感知仍然會相當好。

  相反,如果我們將兩個AP之間的距離拉遠到30米,每個AP上都接入使用者,並且採用大流量,此時,用傳統軟體看到的干擾會較小,但是實際的使用感知卻非常差。

  還有一種情況,如果我們只使用一個AP,並讓幾個使用者同時接入,在使用者處在互相不可見的位置同時觀看高質量視訊時,所有使用者的感知都會很差。但在這種情況下,傳統軟體會認為這是沒有干擾的。

  摩托羅拉系統選擇對整個無線網路的整個物理層實現完整的呈現,包括各個通道的干擾強度、通道使用率以及是否有非WLAN的干擾。在下圖的示例中,通道11的干擾高達-25dBm,但是利用率只有5%,而通道1的干擾在-40到-50dBm之間,介面利用率卻高達100%,而且是持續的微波干擾。在這種情況下,通道1干擾小,但基本是不可使用的。通道11干擾極強,卻一定是客戶體驗最好的。因此,物理層視覺化在無線網路中是非常重要的。

無線網路

  2.3 您真的知道網路的情況嗎?

  在傳統乙太網中,如果使用者出現玩遊戲頻繁“卡”的情況,那麼,檢視一下網際網路出口的擁塞程度和使用者Ping DHCP伺服器的響應時間,就基本可以定位問題所在了。但是對於無線網路而言,頻繁“卡”很有可能是無線和有線雙重因素導致。

  如果是響應較慢,需要定位是無線慢還是有線慢;如果是無線慢,還要確認是哪種無線因素導致了緩慢。那麼,到底是由於干擾、衝突、,無線網路整體效能不足還是覆蓋不合理的頻繁漫遊切換導致了這個問題呢?

  有些時候,由於無線網路是共享式的,我們在無線中只要有一個或幾個使用者是低速率使用者,整體網路效能就會大幅度的下降。在20個終端中部分是802.11n AP的網路(如18個802.11n加2個802.11b),其整體網路效能可能遠遠低於20個均是802.11g的網路卡。因此,如果一個使用者玩遊戲卡,很有可能是另外一個使用者的網路卡速率低造成的。

  另外,如何排查使用者在兩個AP間頻繁切換的問題呢?如何排查使用者的效能是由於干擾造成的呢?對於無線網路的排錯需要看一個通道、一個使用者、一個BSS的整體情況,而不是僅僅排查某個使用者。

  摩托羅拉系統通過一個介面可以遠端的瞭解資料的訊號噪聲比(干擾)、使用者的重傳(空口負載情況)、資料傳輸速率(是否有低速率使用者影響了整個網路效能)、使用者的傳輸通道分配(是否使用者短時間內在兩個不同通道內發射,也就是在頻繁漫遊),完全視覺化地監控全部可能存在的故障。

無線網路

  如果網管人員不足、無法實時監控時,摩托羅拉系統可以定義網路質量劣化的兩大重要指標——傳輸速率和重傳率的門限,對網路進行實時監控,一旦指標超越門限值即可通過告警瞭解到這一情況,並且通過對歷史資料的詳細分析確認網路故障的具體原因。

  例如從附圖中網管員瞭解過去24小時中的不同型別報文比例,如果將這一趨勢分析放大到季度或者年度,我們又可以分析網路趨勢,及時調整網路以避免問題的大規模爆發。

無線網路
無線網路
無線網路

  三、通過故障排查視覺化確保網路的真正可用性

  網路最後100米由WLAN接管是大勢所趨,應用的多終端協同化是大勢所趨,關鍵應用效率提升通過移動應用方式實現也是大勢所趨。無線網路技術倒退是實際情況,無線網路的物理介質脆弱是實際情況,無線網路不可視也是實際情況。

  要求無線網路完全無故障是不現實的,在這樣的實際要求下,無線網路故障排查的高效率是我們必須提供的,尤其是將關鍵應用部署於無線之上的機構。

相關文章