區域網有的電腦能上網有的不能上網故障排查案例

clown_發表於2016-09-29

  電腦上不去網原因有很多,主要還是要靠有經驗的網管去一一排查,本篇文章為大家分享一個電腦上不去網的解決案例,故障排查的過程比較曲折,使用了好多辦法都沒用,最後才查出故障的原因是由於交換機設定不正確而導致埠短路,分享給大家,希望對遇到同樣問題的人有所幫助。

  故障現象

  某單位區域網規模適中,大約有100臺左右的普通客戶機分佈在四層樓中,每個樓層中的所有客戶端系統都透過超五類網路線纜,連線到H3C S3050型號的樓層交換機中,各個樓層交換機又透過1000M光纖線纜與單位區域網的核心交換機相連,整個區域網透過硬體防火牆與外網保持連線,平時所有客戶端系統都能正常訪問外網;為了保證區域網的執行安全性,網管特地將每一個樓層中的計算機劃分到同一個虛擬工作子網中,各個虛擬工作子網相互之間是不能訪問的。最近不知道什麼原因,區域網中有一部分客戶端系統上網突然不正常,具體現象表現為上網速度非常緩慢,並且時常會發生一會兒能上網、一會兒不能上網的奇怪故障;經過網管現場勘察,發現這些上網不正常的客戶端系統幾乎都位於同一個樓層,而另外樓層中的普通客戶端系統卻能夠正常上網。

  排查過程

  1、檢視物理連線

  由於故障現象僅僅侷限於同一個樓層,並且這種現象與網路接觸不良十分相似,網管下意識地認為對應樓層中的交換機與區域網的核心交換機之間,可能存在物理連線不牢靠的現象。於是,網管立即將連線故障交換機與核心交換機之間的網路線纜拔下來,並使用專業的線纜測試儀測試了線纜的連通性,發現物理線纜不存在問題,之後將網路線纜兩端重新插入到交換埠中,並確保水晶頭與交換埠之間接觸牢靠。不過,當網管在任意一臺客戶端系統中,嘗試使用ping命令測試區域網閘道器地址時,發現測試效果還是不穩定,同時資料丟包也比較嚴重,顯然物理連線並不是故障原因。

  2、檢視ARP病毒

  考慮到客戶端系統使用的IP地址與樓層交換機使用的IP地址,位於相同的工作網段中,再加上最近的ARP病毒非常流行,為此網管開始懷疑對應樓層工作子網中存在ARP病毒;由於故障計算機所在的工作子網中包含有幾十臺上網主機,如何快速判斷ARP毒源的位置,並將帶毒客戶端系統從虛擬工作子網中隔離開來,保證其他客戶端系統安全、穩定上網,就成為了網管的當下之急。

  儘管手頭沒有ARP病毒監控工具,網管經過檢視區域網的拓撲圖資料,發現每個樓層交換機都支援網路管理,同時它們都啟用了日誌記憶功能,這個功能會對該交換機下面由ARP病毒引起的地址衝突現象進行跟蹤記錄。基於這一點,網管準備登入進入故障交換機後臺系統,檢視一下系統的日誌記錄,看看有沒有相關的地址衝突資訊;想到做到,網管立即透過console控制埠,登入到故障交換機後臺管理系統,在該系統的全域性配置模式下執行"display logbuf"命令,從彈出的結果介面中,網管並沒有找到由ARP病毒引起的地址衝突記錄,這說明對應虛擬工作子網中沒有ARP病毒。

  3、檢視廣播風暴

  既然故障工作子網中沒有ARP病毒,同時樓層交換機與核心交換機之間的物理連線也是正常的,那麼區域網中可能存在廣播風暴現象,該現象造成了網路傳輸通道發生了堵塞,這樣一來故障工作子網中的客戶端系統在上網訪問時,就會出現上網速度緩慢或者一會兒能上網、一會兒不能上網的奇怪故障了。為了確認對應虛擬工作子網中是否存在廣播風暴現象,網管進入區域網的核心交換機後臺系統,使用interface命令進入故障樓層交換機與核心交換機的級聯埠,執行"display interface xxx"命令,來檢視指定級聯埠的工作狀態;結果發現該級聯埠的工作狀態有時為"up"狀態,有時為"down"狀態;更為奇怪的是,該級聯埠的輸入資料包與輸出資料包大小明顯不正常,資料流量比平時大了十多倍,為什麼故障工作子網中的資料流量突然變得這麼大呢?難道對應虛擬工作子網中存在惡意BT 下載現象?可是,當網管反覆執行"display interface xxx"命令時,發現該埠的廣播資料包流量在不斷地變大,顯然該埠下面的虛擬工作子網中存在廣播風暴現象。

  4、檢視埠環路

  在弄清楚故障虛擬工作子網中存在廣播風暴現象後,接下來的工作就是尋找造成廣播風暴現象的具體"禍首".考慮到造成廣播風暴現象的因素比較多,例如網路裝置損壞,網路連線形成環路、網路病毒等等,不過最常見的因素往往都是使用者操作不小心,無意中在虛擬工作子網中形成了網路環路。

  考慮到區域網中的交換機都啟用了網路環路測試功能,為了排除網路環路因素,網管立即進入故障樓層交換機後臺系統,在該系統命令列狀態下執行"display logbuf"命令,檢視交換機的日誌記錄,發現日誌記錄明確表明8號交換埠存在網路環路現象。趕到故障交換機現場時,網管發現8號交換埠訊號燈處於閃亮狀態,這說明該埠正處於工作狀態;當嘗試拔出連線到該交換埠上的網路線纜時,網管感到非常意外,在斷開網路連線的情況下,該交換埠竟然還處於閃亮狀態,這是怎麼回事呢?難道是該交換埠發生了硬體損壞?

  故障解決

  既然該交換埠存在網路環路,網管決定先將該交換埠關閉掉,看看對應交換機所在的工作子網狀態是否恢復正常。說到做到,網管立即登入進入故障交換機後臺系統,執行"interface e0/8"命令,進入e0/8交換埠的檢視模式狀態,在該狀態下繼續執行字串命令"shutdown",將e0/8交換埠的工作狀態關閉掉。

  之後,網管嘗試著在故障客戶端系統,執行ping命令,測試對應虛擬工作子網的閘道器地址,結果發現ping命令測試操作正常,難道故障客戶端系統現在能正常上網了?再進行上網測試時,網管看到先前發生的上網速度緩慢,一會兒能上網、一會兒不能上網的奇怪故障已經消失了,顯然網路故障已經得到了成功解決。

  故障反思

  雖然上面的故障現象已經消失了,但是讓網管感到十分納悶的是,為什麼故障交換機的e0/8交換埠,在斷開網路連線的情況下,它仍然能夠處於點亮狀態,同時該埠還存在網路環路現象?經過仔細分析,網管認為該交換埠內部可能發生了短路現象,該現象直接造成了目標交換埠在無網路連線的情況下,也能夠正常處於點亮狀態;當該交換機的交換埠發生短路後,就相當於在對應虛擬工作子網中形成了網路環路,該環路引發了廣播風暴現象,最終導致故障交換機工作效能下降,表現出來的故障現象就是上網速度緩慢,同時上網連線也不穩定。

  當然,這類網路故障由於發生在具有環路測試功能的交換機上,網管只要從交換機後臺系統日誌記錄中,就能快速地尋找到具體的環路位置;不過該故障要是發生在不支援環路測試功能的交換機上時,那麼該故障排除起來就比較麻煩了。此時,我們可以嘗試在斷開交換機所有網路連線的情況下,重新啟動一次交換機後臺系統,並且仔細觀察各個交換埠的訊號燈狀態,如果發現某個交換埠在沒有任何連線的情況下,埠訊號燈狀態仍然閃爍,那麼我們就能肯定該交換埠發生了短路現象。

相關文章