SUN FIRE V440記憶體問題

salanghe發表於2009-11-24

某天發現4G記憶體只剩3G在跑,於是將此伺服器的服務全部切換到備機上。透過諮詢SUN工程師得知此次出問題記憶體為CPU1(編號J01,每個CPU都有4個DIMM記憶體插槽)上的J0701槽出問題,須更換J0701和J0702上兩根記憶體。
相關的日誌資訊如下:
0>MSG = Board Rev < P2. Cannot Run 32K-SRAM Test
0>END_WARNING

[@more@]

某天發現4G記憶體只剩3G在跑,於是將此伺服器的服務全部切換到備機上。透過諮詢SUN工程師得知此次出問題記憶體為CPU1(編號J01,每個CPU都有4個DIMM記憶體插槽)上的J0701槽出問題,須更換J0701和J0702上兩根記憶體。
相關的日誌資訊如下:
0>MSG = Board Rev < P2. Cannot Run 32K-SRAM Test
0>END_WARNING

Done
0>IO-Bridge Tests....|
1>ERROR: TEST = Block Memory
1>H/W under test = CPU1 B1/D0 J0701 side 1 (Bank 2), CPU Module C1
1>Repair Instructions: Replace items in order listed by 'H/W under test' above.
1>MSG = Pin 72 failed on CPU1 B1/D0 J0701 side 1 (Bank 2), CPU Module C1
1>END_ERROR

Done
0>ERROR:
0> POST toplevel status has the following failures:
0> CPU1 B1/D0 J0701 side 1 (Bank 2), CPU Module C1
0>END_ERROR

0>
0>POST: Return to OBP.

由於不在SUN免費上門服務的區域,為了節省費用,於是由自己根據以上資訊進行更換。更換過程還算順利,更換後伺服器啟動沒發現錯誤,只是用TOP命令檢視到CPU佔用率很高,達到99%以上,重啟後問題依舊,觀察了差不多1個小時還是這樣。由於是晚上,因此沒管,等第二天再看時CPU佔用已經正常。

透過此次故障,我才知道原來小機的記憶體出問題還是可以正常跑業務的,此次是自己第一次開小機,算是冒了一次險。

來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/744768/viewspace-1029011/,如需轉載,請註明出處,否則將追究法律責任。

相關文章