Server stürtz einfach ab ?!?

Post Reply
Message
Author
christian
Posts: 238
Joined: 13. Jul 2001 11:29
Contact:

Server stürtz einfach ab ?!?

#1 Post by christian »

Hallo zusammen,

wir haben bei einem Kunden eine SuSE-Linux (8.1) Installation gemacht und haben folgendes Problem.
Die Hardware hat der Kunde selbst geliefert. Es handelt sich dabei um einen Dell PowerEdge 1400 SC.

Die Installation verlief soweit ohne Probleme.
Die Hardware wurde fehlerfrei erkannst und funktioniert bestens.
Jetzt ist es so, dass die Maschine ganz plötzlich abstürtzt.
Vom einem Moment auf den anderen. Ohne das jemand etwas daran gemacht hat.
Der Bildschirm ist in diesem Zustand schwarz und an der Tastatur blinken die Num-Lock und die Caps-Lock LED.
Das wars. Diesen Unsinn hat die Maschine innerhalb von zwei Wochen schon zweimal gemacht.
Hat jemand eine Ahnung was da los seien kann?
Ein Hardwarefehler kann ich ausschließen, weil zuvor Windows 2000 Server drauf installiert war und dieses System über ein Jahr lief.

Ich liste hier noch mal ein paar seltsame Meldungen aus der "/var/log/messages" auf.
Damit kann ich wenig anfangen. Ich hoffe, ihr mehr. Vielleicht geben diese ja schon aufschluss auf das Problem.
Also, vielen Dank schon mal.


--- SCHNIPP --- --- ---

Mar 3 05:59:00 luchs kernel: Unable to handle kernel paging request at virtual address ffff25c2
Mar 3 05:59:00 luchs kernel: printing eip:
Mar 3 05:59:00 luchs kernel: c010fb20
Mar 3 05:59:00 luchs kernel: *pde = 00004063
Mar 3 05:59:00 luchs kernel: Oops: 0002 2.4.19-4GB #1 Fri Sep 13 13:14:56 UTC 2002
Mar 3 05:59:00 luchs kernel: CPU: 0
Mar 3 05:59:00 luchs kernel: EIP: 0010:[convert_fxsr_from_user+128/224] Not tainted
Mar 3 05:59:00 luchs kernel: EIP: 0010:[<c010fb20>] Not tainted
Mar 3 05:59:00 luchs kernel: EFLAGS: 00013202
Mar 3 05:59:00 luchs kernel: eax: 00000002 ebx: cb5042d0 ecx: 00000000 edx: 00000001
Mar 3 05:59:00 luchs kernel: esi: bfffec26 edi: cb5042da ebp: bfffec1c esp: cb505f28
Mar 3 05:59:00 luchs kernel: ds: 0018 es: 0018 ss: 0018
Mar 3 05:59:00 luchs kernel: Process X (pid: 15787, stackpage=cb505000)
Mar 3 05:59:00 luchs kernel: Stack: cb505f48 cb504560 0000000e 00000000 ffff037f ffff0020 ffffffff 080fb0e9
Mar 3 05:59:00 luchs kernel: 039d0023 bfffda38 0000002b c0139f7b bfffeba8 00001f80 bfffec00 bfffeba8
Mar 3 05:59:00 luchs kernel: c010f410 cb5042b0 bfffec00 00000000 00000000 c010811c bfffec00 00000000
Mar 3 05:59:00 luchs kernel: Call Trace: [kfree+43/64] [restore_i387+128/192] [restore_sigcontext+300/320] [sys_sigreturn+212/240] [system_call+51/64]
Mar 3 05:59:00 luchs kernel: Call Trace: [<c0139f7b>] [<c010f410>] [<c010811c>] [<c0108204>] [<c0108e63>]
Mar 3 05:59:00 luchs kernel: Code: 20 89 c2 25 ff ff 00 00 c1 ea 10 89 43 0c 66 89 53 06 31 d2
Mar 3 05:59:00 luchs kernel: klogd 1.4.1, ---------- state change ----------
Mar 3 05:59:00 luchs kernel: Inspecting /boot/System.map-2.4.19-4GB
Mar 3 05:59:00 luchs kernel: Loaded 14329 symbols from /boot/System.map-2.4.19-4GB.
Mar 3 05:59:00 luchs kernel: Symbols match kernel version 2.4.19.
Mar 3 05:59:00 luchs kernel: Loaded 553 symbols from 7 modules.



Mar 3 06:24:15 luchs -- MARK --
Mar 3 06:44:15 luchs -- MARK --



Mar 4 16:46:40 luchs kernel: klogd 1.4.1, log source = /proc/kmsg started.
Mar 4 16:46:40 luchs kernel: Inspecting /boot/System.map-2.4.19-4GB
Mar 4 16:46:40 luchs kernel: Loaded 14329 symbols from /boot/System.map-2.4.19-4GB.
Mar 4 16:46:40 luchs kernel: Symbols match kernel version 2.4.19.
Mar 4 16:46:40 luchs kernel: Loaded 542 symbols from 6 modules.
Mar 4 16:46:40 luchs kernel: Intel(R) PRO/100 Network Driver - version 2.1.15
Mar 4 16:46:40 luchs kernel: Copyright (c) 2002 Intel Corporation
Mar 4 16:46:40 luchs kernel:
Mar 4 16:46:40 luchs kernel: PCI: Found IRQ 9 for device 00:02.0
Mar 4 16:46:40 luchs kernel: IRQ routing conflict for 00:02.0, have irq 11, want irq 9
Mar 4 16:46:40 luchs kernel: e100: eth0: Intel(R) 8255x Based Network Connection
Mar 4 16:46:40 luchs kernel: Mem:0xfe102000 IRQ:11 Speed:0 Mbps Dx:N/A
Mar 4 16:46:40 luchs kernel: Failed to detect cable link
Mar 4 16:46:40 luchs kernel: Speed and duplex will be determined at time of connection
Mar 4 16:46:40 luchs kernel: Hardware receive checksums enabled
Mar 4 16:46:40 luchs kernel: cpu cycle saver enabled
Mar 4 16:46:40 luchs kernel:
Mar 4 16:46:40 luchs kernel: e100: eth0 NIC Link is Up 100 Mbps Full duplex
Mar 4 16:46:40 luchs kernel: IPv6 v0.8 for NET4.0
Mar 4 16:46:40 luchs kernel: IPv6 over IPv4 tunneling driver



Mar 4 16:46:40 luchs nmbd-classic[418]: [2003/03/04 16:46:40, 0] nmbd/nmbd_responserecordsdb.c:find_response_record(235)
Mar 4 16:46:40 luchs nmbd-classic[418]: find_response_record: response packet id 18234 received with no matching record.
Mar 4 16:46:40 luchs nmbd-classic[418]: [2003/03/04 16:46:40, 0] nmbd/nmbd_responserecordsdb.c:find_response_record(235)
Mar 4 16:46:40 luchs nmbd-classic[418]: find_response_record: response packet id 18235 received with no matching record.



Mar 4 16:44:03 luchs kernel: mtrr: Serverworks LE detected. Write-combining disabled.
Mar 4 16:44:03 luchs kernel: mtrr: your processor doesn't support write-combining

--- SCHNAPP --- --- ---

Gruß,
Christian

nobody
Posts: 35
Joined: 04. Mar 2003 19:00
Contact:

Re: Server stürtz einfach ab ?!?

#2 Post by nobody »

hi,

klingt irgendwie nach speicherfehler, ist er vielleicht mal zu warm geworden, ich hatte frueher der oefteren systemabstürze wegen ueberhitzung. es koennte auch ein problem mit einer platte sein, die noch nicht ganz tot ist, aber abundzu mal den anschein erweckt.

cu

christian
Posts: 238
Joined: 13. Jul 2001 11:29
Contact:

Re: Server stürtz einfach ab ?!?

#3 Post by christian »

Das es ein Hardware-Problem ist, würde mich wundern. Einfach aus dem Grund, weil vorher die Windows-Installation einwandfrei lief.
Was mit 'grad nich einfällt. Im dem Zustand des Absturzes, funktioniert der Ping noch.

User avatar
hjb
Pro-Linux
Posts: 3264
Joined: 15. Aug 1999 16:59
Location: Bruchsal
Contact:

Re: Server stürtz einfach ab ?!?

#4 Post by hjb »

Hi,

diesen Oops solltest du durch ksymoops laufen lassen und an SuSE und/oder die Kernel-Mailingliste senden. Ich kann zwar momentan nicht beurteilen, was es ist, aber Kernel-Experten sollten damit was anfangen können.

Gruß,
hjb
Pro-Linux - warum durch Fenster steigen, wenn es eine Tür gibt?

User avatar
max
Posts: 806
Joined: 14. May 2000 12:55
Location: Ruhrpott

Re: Server stürtz einfach ab ?!?

#5 Post by max »

ich würde 2 Wege austesten.
- Fehler in der Hardware suchen. Speicher tauschen, Proz. tauschen, Mainboard tauschen....
- aktuelle Vanilla-Kernel-Source saugen und Kernel backen.
Auch wenn die Hardware unter M$ lief heißt es nicht das diese wirklich OK ist.
Eine Kiste lief hier Jahrelang mit NT ohne Probleme. Mit SuSE hatte diese Kist nur Abstürze.
Wenn ich mich recht erinnere war nach Speichertausch alles i.O. (oder anderes Mainboard)
Gruss
Max

Bob Gomorrha

Re: Server stürtz einfach ab ?!?

#6 Post by Bob Gomorrha »

Versuch einfach mal den orig. Dell Kernel - gibts hier:

<a href="http://www.dell.com/us/en/esg/topics/li ... al.htm#005" target="_blank"><!--auto-->http://www.dell.com/us/en/esg/topics/li ... <!--auto-->

Nicht schreien: "Ist ja alt!" - in Linux heisst das "getestet", "erprobt", "bewährt".

Aufgrund der Tatsache, dass die Kiste unter Win gelaufen ist, und es sich ja nicht gerade um ein "Aldi" oder "Bild" Teil handelt, tendiere ich auch eher zu einem "Nicht schuldig" für die Hardware.

Einige Einstellung von Hand werden Dir aber sicher nicht erspart bleiben.

cu

bg

christian
Posts: 238
Joined: 13. Jul 2001 11:29
Contact:

Re: Server stürtz einfach ab ?!?

#7 Post by christian »

Die Idee mit dem original Dell-Kernel ist vielleicht nicht schlecht.
Krieg ich den mit SuSE-8.1 zum starten?
Dort ist immer von RedHat die rede.

Wenn das nichts hilft, und die Dell Kiste nur mit RH zufrieden ist, dann
bekommt der Kunden halt RH.

Das wird sich sicherlich rausstellen.
Last edited by christian on 05. Mar 2003 14:48, edited 1 time in total.

Post Reply