vmware平臺下兩次網路不通的詭異事件

Federico發表於2019-01-28

  首先表明以下兩種情況確實很少見,也可以說確實非常奇怪,無法定位原因由於機緣巧合確實出現了,雖然本文沒有找到根因,但是希望能幫遇到類似問題的同學一點思緒。

RouteOS內網網路卡不可用

  首先強調下RouteOS在vmware中,網路卡如果工作在橋接模式,並且要啟用RouteOS的VRRP服務,那麼ESXI網路卡的工作模式必須設定為Promiscuous Mode(混雜模式)和Forged Transmits(偽傳輸)這兩個必須都為開啟狀態,否則VRRP服務將無法正常啟動。
  在配置VRRP併成功執行了一段時間後,突然發現RouteOS其中的一塊網路卡不能ping通其他地址了,但是其他地址ping此臺RouteOS的地址卻是正常的,嘗試過關機重啟,但是仍未恢復,最終在經過客戶同意後將此臺RouteOS上所有的路由以及策略禁用,發現測試通網段地址可以通了,第一時間判斷可能是錯誤的策略導致,但是有相同配置的RouteOS卻是正常的,而且當最後將所有的路由以及策略啟動後,發現該RouteOS仍然是正常狀態,真是活久見。

CentOS7.5無法ping通閘道器

  今天又遇到了一個非常奇怪的現象,一臺CentOS7雲主機無法ping通閘道器,而且是突然出現的,客戶收到報警後聯絡我們進行排查,發現同網段其他雲主機正常,只有這一臺有問題,表現為:

  • 該雲主機ping閘道器不通;
  • 該雲主機ping同網段其他雲主機正常;
  • 同網段雲主機ping閘道器以及同網段其他雲主機正常;
  • 此問題是突然出現,出現前網路無調整,雲主機無配置變更;
  • 檢視雲主機在故障時間段無錯誤日誌。

排查思路

  1. 首先確認是否故障前是否存在人為操作,以及當前是否可以重啟伺服器(第一時間恢復業務才是重中之重,業務恢復後在開始排查原因,雖然最後確認了此問題無解)。
  2. 確認了網路卡沒有配置變更,並且在重啟伺服器後仍未恢復(問題開始變得棘手)。
  3. 檢視該雲主機是否可以學習到閘道器的MAC地址,發現這臺雲主機並不能學習到閘道器的MAC地址。
  4. 使用arp -s gateway.ip gateway.mac命令配置靜態MAC地址,配置後發現可以通,確認了是無法學習到MAC地址導致。
  5. 使用這種方法不是長久之計,畢竟不能每次重啟都配置靜態MAC,雖然可以寫rc.local配置檔案,但是這並不是我和客戶想要的。
  6. 克隆該雲主機並新建同網段測試機,發現配置IP後到閘道器都沒問題。
  7. 將此臺雲主機IP地址更改為其他地址,確認是否是該IP地址出現問題,並將測試機地址配置成不通的IP地址,發現配置後都正常。
  8. 將雲主機地址更改回最初地址,使用arping測試發現可以學習到閘道器的MAC地址了,問題解決了。

總之是很無解的一件事情,子不語怪力亂神,但是還是要吐槽下,誰讓這事情都讓我碰到了呢!

相關文章