一個奇怪的dell sc440安裝redhat5.2問題

tonykorn97發表於2008-12-07

一個奇怪的dell sc440安裝redhat5.2問題,絕對值得一看。

公司經常用dell sc440的機器做其他伺服器的備份機,等其他伺服器有問題的時候用這臺伺服器先頂幾天的時間,這種sc440的機器已經很多了,也安裝了很多臺redhat5.2。

[@more@]

這天新到一臺sc440的機器需要安裝redhat5.2。因為後面還會有一臺機器安裝,所以這臺新到的機器就叫A,後面的一臺就叫B。

問題1:
這臺A機器到的時候,因為這些伺服器都沒有光碟機,所以先接一個ide的光碟機在機房裡面安裝,安裝的時候可以引導系統,但是到選擇安裝方式的時候彈出是用cdrom還是ftp,nfs的介面,如果正常情況下是不會彈出這個介面的。這時候選擇用cdrom安裝,等一下光碟機就彈出來了,讓放入光碟。不過這張光碟可以證明是正常的,不過又有一點不理解的是這臺A機器可以引導系統,證明光碟機和光碟都是正常的,不知道為什麼不能安裝。

問題2:
在選擇安裝介質的時候選擇用ftp安裝,但是到安裝到一個包的時候就一直過不去。

因為一直在機房安裝也不是太方便,所以此時把這臺A機器抱到我的位置旁邊進行安裝,安裝的時候換成stat光碟機。
問題3:
在安裝的時候經常當機,用ctrl+alt+f3切換介面,看到介面上出現下面的錯誤:
ata1.00: status: { DRDY }
ata1: port is slow to respond, please be patient (Status 0xd0)
ata1: device not ready (errno=-16), forcing hardreset
ata1: soft resetting link
ata1.00: configured for UDMA/25
ata1: EH complete
ata1.00: exception Emask 0x0 SAct 0x0 SErr 0x0 action 0x2 frozen
ata1.00: cmd a0/01:00:00:80:00/00:00:00:00:00/a0 tag 0 dma 128 in
cdb 5a 00 2a 00 00 00 00 00 80 00 00 00 00 00 00 00
res 40/00:03:00:00:00/00:00:00:00:00/a0 Emask 0x4 (timeout)
ata1.00: status: { DRDY }
ata1: port is slow to respond, please be patient (Status 0xd0)
ata1: device not ready (errno=-16), forcing hardreset
ata1: soft resetting link
ata1.00: configured for UDMA/25
ata1: EH complete
ata1.00: exception Emask 0x0 SAct 0x0 SErr 0x0 action 0x2 frozen
ata1.00: cmd a0/01:00:00:80:00/00:00:00:00:00/a0 tag 0 dma 128 in
cdb 5a 00 2a 00 00 00 00 00 80 00 00 00 00 00 00 00
res 40/00:03:00:00:00/00:00:00:00:00/a0 Emask 0x4 (timeout)
ata1.00: status: { DRDY }

問題4:
用過dell的機器的人都知道,dell的機器附帶一張光碟,用這個光碟可以引導安裝作業系統,就測試用這種方式安裝,事實證明用這張光碟引導安裝作業系統就可以。

問題5:
這個時候懷疑是機器和作業系統的相容性有問題,還是測試安裝其他版本的作業系統,發現可以安裝上redhat5.0 i386版本的系統,不過在啟動的過程中發現出現下面的提示:
SCSI subsystem initialized
libata version 2.00 loaded.
ata_piix 0000:00:1f.2: version 2.00
ata_piix 0000:00:1f.2: MAP [ P0 P2 P1 P3 ]
ACPI: PCI Interrupt 0000:00:1f.2[C] -> GSI 20 (level, low) -> IRQ 66
PCI: Setting latency timer of device 0000:00:1f.2 to 64
ata1: SATA max UDMA/133 cmd 0xFE00 ctl 0xFE12 bmdma 0xFEC0 irq 66
ata2: SATA max UDMA/133 cmd 0xFE20 ctl 0xFE32 bmdma 0xFEC8 irq 66
scsi0 : ata_piix
usb 3-2: new low speed USB device using uhci_hcd and address 3
usb 3-2: configuration #1 chosen from 1 choice
input: Tripplite B015-000 R0.74 USB to PS2 adapter. as /class/input/input0
input: USB HID v1.10 Keyboard [Tripplite B015-000 R0.74 USB to PS2 adapter.] on usb-0000:00:1d.2-2
input: Tripplite B015-000 R0.74 USB to PS2 adapter. as /class/input/input1
input: USB HID v1.10 Mouse [Tripplite B015-000 R0.74 USB to PS2 adapter.] on usb-0000:00:1d.2-2
ata1.00: ATA-8, max UDMA/133, 312500000 sectors: LBA48 NCQ (depth 0/32)
ata1.00: ata1: dev 0 multi count 8
ata1.01: ATAPI, max UDMA/33
ata1.00: configured for UDMA/33
ata1.01: configured for UDMA/33
scsi1 : ata_piix
ata2: port is slow to respond, this delay is known to occur on vacant SATA ports
ata2: port failed to respond (30 secs)
ata2: SRST failed (status 0xFF)
ata2: SRST failed (err_mask=0x100)
ata2: softreset failed, retrying in 5 secs
ata2: SRST failed (status 0xFF)
ata2: SRST failed (err_mask=0x100)
ata2: softreset failed, retrying in 5 secs
ata2: SRST failed (status 0xFF)
ata2: SRST failed (err_mask=0x100)
ata2: reset failed, giving up
Vendor: ATA Model: WDC WD1601ABYS-1 Rev: 06.0
Type: Direct-Access ANSI SCSI revision: 05
SCSI device sda: 312500000 512-byte hdwr sectors (160000 MB)
sda: Write Protect is off


從上面可以發現硬碟是西數的硬碟,檢視公司正在使用的sc440機器,發現硬碟的型號是:
SCSI subsystem initialized
libata version 3.00 loaded.
ata_piix 0000:00:1f.2: version 2.12
ata_piix 0000:00:1f.2: MAP [ P0 P2 P1 P3 ]
GSI 22 sharing vector 0x42 and IRQ 22
ACPI: PCI Interrupt 0000:00:1f.2[C] -> GSI 20 (level, low) -> IRQ 66
PCI: Setting latency timer of device 0000:00:1f.2 to 64
scsi0 : ata_piix
scsi1 : ata_piix
ata1: SATA max UDMA/133 cmd 0xfe00 ctl 0xfe10 bmdma 0xfec0 irq 66
ata2: SATA max UDMA/133 cmd 0xfe20 ctl 0xfe30 bmdma 0xfec8 irq 66
ata1.00: ATA-7: SAMSUNG HE160HJ, JF800-24, max UDMA7
ata1.00: 312500000 sectors, multi 8: LBA48 NCQ (depth 0/32)
ata1.00: configured for UDMA/133
Vendor: ATA Model: SAMSUNG HE160HJ Rev: JF80
Type: Direct-Access ANSI SCSI revision: 05
SCSI device sda: 312500000 512-byte hdwr sectors (160000 MB)
sda: Write Protect is off

問題6:
從其他地方重新搞了一臺sc440的機器,就叫B機器吧,這臺機器也是新訂購的,也沒有安裝作業系統,不過硬碟的型號是SAMSUNG HE160HJ,和正在使用的系統是同一型號的。把這臺出錯的A機器更換硬碟,更換成B機器的SAMSUNG HE160HJ硬碟,安裝的時候也是到格式化的時候當機,錯誤和問題3一樣,證明不是硬碟引起的相容性問題。

問題7:
把新得到的B伺服器,用A機器的西數硬碟,重新安裝作業系統。也是不能安裝,也是當機,和問題3一樣。

問題8:
把這兩臺機器的硬體都恢復,各自用各自的硬體,重新用B伺服器安裝作業系統,結果還是一樣,當機,此時都比較鬱悶了,因為這臺B機器和現在正在使用的機器是一模一樣的,並且正在使用的機器都已經安裝上redhat5.2有很多了。

驗證以前伺服器的主機板控制資訊,確實和現在的這臺B機器的控制晶片一模一樣:
[root@test ~]# lspci
00:00.0 Host bridge: Intel Corporation E7230/3000/3010 Memory Controller Hub
00:01.0 PCI bridge: Intel Corporation E7230/3000/3010 PCI Express Root Port
00:1c.0 PCI bridge: Intel Corporation 82801G (ICH7 Family) PCI Express Port 1 (rev 01)
00:1c.4 PCI bridge: Intel Corporation 82801GR/GH/GHM (ICH7 Family) PCI Express Port 5 (rev 01)
00:1c.5 PCI bridge: Intel Corporation 82801GR/GH/GHM (ICH7 Family) PCI Express Port 6 (rev 01)
00:1d.0 USB Controller: Intel Corporation 82801G (ICH7 Family) USB UHCI Controller #1 (rev 01)
00:1d.1 USB Controller: Intel Corporation 82801G (ICH7 Family) USB UHCI Controller #2 (rev 01)
00:1d.2 USB Controller: Intel Corporation 82801G (ICH7 Family) USB UHCI Controller #3 (rev 01)
00:1d.3 USB Controller: Intel Corporation 82801G (ICH7 Family) USB UHCI Controller #4 (rev 01)
00:1d.7 USB Controller: Intel Corporation 82801G (ICH7 Family) USB2 EHCI Controller (rev 01)
00:1e.0 PCI bridge: Intel Corporation 82801 PCI Bridge (rev e1)
00:1f.0 ISA bridge: Intel Corporation 82801GB/GR (ICH7 Family) LPC Interface Bridge (rev 01)
00:1f.1 IDE interface: Intel Corporation 82801G (ICH7 Family) IDE Controller (rev 01)
00:1f.2 IDE interface: Intel Corporation 82801GB/GR/GH (ICH7 Family) SATA IDE Controller (rev 01)
00:1f.3 SMBus: Intel Corporation 82801G (ICH7 Family) SMBus Controller (rev 01)
04:00.0 Ethernet controller: Broadcom Corporation NetXtreme BCM5754 Gigabit Ethernet PCI Express (rev 02)
05:07.0 VGA compatible controller: ATI Technologies Inc ES1000 (rev 02)
[root@test ~]#


問題得到解決:
上面也說了,從問題3開始這兩臺A機器和B機器都是在辦公室安裝的,辦公桌上面也不能同時放兩套鍵盤滑鼠和兩臺顯示器,所以安裝的時候是用的一套鍵盤滑鼠和一個顯示器,透過一個kvm連線自己正在用的機器和需要安裝的機器,由於kvm還是ps/2介面的,所以用了一根usb轉ps/2的線轉換。

重新安裝的時候不用kvm連線,全部用usb鍵盤滑鼠連線過去。安裝一路順利,可以正常安裝。

原因:
估計是kvm或者usb轉接ps/2和作業系統的相容性有問題。

來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/312079/viewspace-1014307/,如需轉載,請註明出處,否則將追究法律責任。

相關文章