Swap-Problem bei einem Suse 9.0 mit einem Kernel 2.4.28

Software besorgen und anwenden
Antworten
Nachricht
Autor
micbur
Beiträge: 86
Registriert: 05. Jun 2004 15:55

Swap-Problem bei einem Suse 9.0 mit einem Kernel 2.4.28

#1 Beitrag von micbur » 11. Apr 2006 20:39

Hallo,

auf meinem Clanserver habe ich ein kleines Swapproblem, sodass die Spiele sich aufhängen und alles andere auch. Leider ist es so, dass das gesamte System etwas inkonsitent in den Updates ist. Es ist eine Menge Arbeit zu machen, ich weiß auch net recht, wo man anfangen soll. Ich würde aber gerne erst die Probleme lösen, bevor ich mit dem Einspielen von Patches anfange.

So ist das von Strato halt gekauft. Ursprünglich war es mal ein Suse 9.0 mit einem 2.4.28er Kernel.

Fehlercode sieht so aus

Code: Alles auswählen

Apr 11 03:40:11 h48379 logger: system.info loadavg: 1.00 0.71 0.32 2/161 21014  
Apr 11 03:41:00 h48379 kernel: Unable to handle kernel paging request at virtual address 008bb466  
Apr 11 03:41:00 h48379 kernel:  printing eip:  
Apr 11 03:41:00 h48379 kernel: c011a263  
Apr 11 03:41:00 h48379 kernel: *pde = 00000000  
Apr 11 03:41:00 h48379 kernel: Oops: 0000  
Apr 11 03:41:00 h48379 kernel: CPU:    0  
Apr 11 03:41:00 h48379 kernel: EIP:    0010:[__wake_up+83/304]    Not tainted  
Apr 11 03&#58;41&#58;00 h48379 kernel&#58; EIP&#58;    0010&#58;&#91;<c011a263>&#93;    Not tainted  
Apr 11 03&#58;41&#58;00 h48379 kernel&#58; EFLAGS&#58; 00010087  
Apr 11 03&#58;41&#58;00 h48379 kernel&#58; eax&#58; c2862000   ebx&#58; c2a73dd4   ecx&#58; 008bb466   edx&#58; c89d170c  
Apr 11 03&#58;41&#58;00 h48379 kernel&#58; esi&#58; c2862000   edi&#58; c2862000   ebp&#58; c2863ed8   esp&#58; c2863eb0  
Apr 11 03&#58;41&#58;00 h48379 kernel&#58; ds&#58; 0018   es&#58; 0018   ss&#58; 0018  
Apr 11 03&#58;41&#58;00 h48379 kernel&#58; Process kswapd &#40;pid&#58; 5, stackpage=c2863000&#41;  
Apr 11 03&#58;41&#58;00 h48379 kernel&#58; Stack&#58; c2b73dd4 c2862000 c287b500 00000001 00000282 00000003 c2b73dd0 c2b73d28   
Apr 11 03&#58;41&#58;00 h48379 kernel&#58;        c2b73d20 c2862000 c2863f18 c0162048 c2b73d20 c2862000 c2862000 000020ce   
Apr 11 03&#58;41&#58;00 h48379 kernel&#58;        f5ce2128 c2862000 f5ce2320 00000000 c016238c c2863f18 c280637c f2a3b000   
Apr 11 03&#58;41&#58;00 h48379 kernel&#58; Call Trace&#58;    &#91;dispose_list+168/320&#93; &#91;prune_icache+172/656&#93; &#91;shrink_icache_memory+36/64&#93; &#91;shrink_cache+447/1408&#93; &#91;shrink_caches+84/112&#93;  
Apr 11 03&#58;41&#58;00 h48379 kernel&#58; Call Trace&#58;    &#91;<c0162048>&#93; &#91;<c016238c>&#93; &#91;<c0162594>&#93; &#91;<c013c58f>&#93; &#91;<c013cb04>&#93;  
Apr 11 03&#58;41&#58;00 h48379 kernel&#58;   &#91;try_to_free_pages_zone+98/256&#93; &#91;kswapd_balance_pgdat+108/176&#93; &#91;kswapd_balance+40/64&#93; &#91;kswapd+157/183&#93; &#91;rest_init+0/128&#93; &#91;arch_kernel_thread+46/64&#93;  
Apr 11 03&#58;41&#58;00 h48379 kernel&#58;   &#91;<c013cb82>&#93; &#91;<c013cd4c>&#93; &#91;<c013cdb8>&#93; &#91;<c013cefd>&#93; &#91;<c0105000>&#93; &#91;<c01057ee>&#93;  
Apr 11 03&#58;41&#58;00 h48379 kernel&#58;   &#91;kswapd+0/183&#93;  
Apr 11 03&#58;41&#58;00 h48379 kernel&#58;   &#91;<c013ce60>&#93;  
Apr 11 03&#58;41&#58;00 h48379 kernel&#58;   
Apr 11 03&#58;41&#58;00 h48379 kernel&#58; Code&#58; 8b 01 85 45 ec 74 52 c7 45 e0 00 00 00 00 9c 5f fa 8b 45 dc   
Apr 11 03&#58;41&#58;00 h48379 kernel&#58;  <6>note&#58; kswapd&#91;5&#93; exited with preempt_count 1
Blöderweise hat Strato da eine Netzwerkkarte drin, die auf 600 MBit/s betrieben wird. Ich maße mir nicht an, über den Sinn zu urteilen, aber vielleicht weiß ja jemand, warum das so ist.

Verbaut ist laut 'lspci -v'

Code: Alles auswählen

00&#58;00.0 Host bridge&#58; Intel Corp. 82845G/GL &#91;Brookdale-G&#93; Chipset Host Bridge &#40;rev 03&#41;  
        Subsystem&#58; Super Micro Computer Inc&#58; Unknown device 3680  
        Flags&#58; bus master, fast devsel, latency 0  
        Memory at e8000000 &#40;32-bit, prefetchable&#41; &#91;size=64M&#93;  
        Capabilities&#58; &#91;e4&#93; #09 &#91;4105&#93;  
  
00&#58;02.0 VGA compatible controller&#58; Intel Corp. 82845G/GL &#91;Brookdale-G&#93; Chipset Integrated Graphics Device &#40;rev 03&#41; &#40;prog-if 00 &#91;VGA&#93;&#41;  
        Subsystem&#58; Super Micro Computer Inc&#58; Unknown device 3680  
        Flags&#58; bus master, fast devsel, latency 0, IRQ 16  
        Memory at e0000000 &#40;32-bit, prefetchable&#41; &#91;size=128M&#93;  
        Memory at ec100000 &#40;32-bit, non-prefetchable&#41; &#91;size=512K&#93;  
        Capabilities&#58; &#91;d0&#93; Power Management version 1  
  
00&#58;1e.0 PCI bridge&#58; Intel Corp. 82801BA/CA/DB/EB PCI Bridge &#40;rev 82&#41; &#40;prog-if 00 &#91;Normal decode&#93;&#41;  
        Flags&#58; bus master, fast devsel, latency 0  
        Bus&#58; primary=00, secondary=01, subordinate=01, sec-latency=32  
        I/O behind bridge&#58; 0000a000-0000afff  
        Memory behind bridge&#58; ec000000-ec0fffff  
  
00&#58;1f.0 ISA bridge&#58; Intel Corp. 82801DB LPC Interface Controller &#40;rev 02&#41;  
        Flags&#58; bus master, medium devsel, latency 0  
  
00&#58;1f.1 IDE interface&#58; Intel Corp. 82801DB Ultra ATA Storage Controller &#40;rev 02&#41; &#40;prog-if 8a &#91;Master SecP PriP&#93;&#41;  
        Subsystem&#58; Super Micro Computer Inc&#58; Unknown device 3680  
        Flags&#58; bus master, medium devsel, latency 0, IRQ 18  
        I/O ports at <ignored>  
        I/O ports at <ignored>  
        I/O ports at <ignored>  
        I/O ports at <ignored>  
        I/O ports at cc00 &#91;size=16&#93;  
        Memory at ec181000 &#40;32-bit, non-prefetchable&#41; &#91;size=1K&#93; 
00&#58;1f.3 SMBus&#58; Intel Corp. 82801DB/DBM SMBus Controller &#40;rev 02&#41;  
        Subsystem&#58; Super Micro Computer Inc&#58; Unknown device 3680  
        Flags&#58; medium devsel, IRQ 17  
        I/O ports at 0500 &#91;size=32&#93;  
  
01&#58;05.0 Ethernet controller&#58; Intel Corp. 82540EM Gigabit Ethernet Controller &#40;rev 02&#41;  
        Subsystem&#58; Intel Corp.&#58; Unknown device 004e  
        Flags&#58; bus master, 66Mhz, medium devsel, latency 32, IRQ 22  
        Memory at ec000000 &#40;32-bit, non-prefetchable&#41; &#91;size=128K&#93;  
        I/O ports at a000 &#91;size=64&#93;  
        Capabilities&#58; &#91;dc&#93; Power Management version 2  
        Capabilities&#58; &#91;e4&#93; PCI-X non-bridge device.  
        Capabilities&#58; &#91;f0&#93; Message Signalled Interrupts&#58; 64bit+ Queue=0/0 Enable-  
  
01&#58;06.0 Ethernet controller&#58; Intel Corp. 82540EM Gigabit Ethernet Controller &#40;rev 02&#41;  
        Subsystem&#58; Intel Corp.&#58; Unknown device 004e  
        Flags&#58; bus master, 66Mhz, medium devsel, latency 32, IRQ 23  
        Memory at ec020000 &#40;32-bit, non-prefetchable&#41; &#91;size=128K&#93;  
        I/O ports at a400 &#91;size=64&#93;  
        Capabilities&#58; &#91;dc&#93; Power Management version 2  
        Capabilities&#58; &#91;e4&#93; PCI-X non-bridge device.  
        Capabilities&#58; &#91;f0&#93; Message Signalled Interrupts&#58; 64bit+ Queue=0/0 Enable-  

Kann damit jemand was anfangen?
Mir sagt die Fehlermeldung leider nicht viel und ich weiß daher auch nicht, was man machen kann und wonach ich eigentlich suche.

Ciao, micbur

klopskuchen
prolinux-forum-admin
Beiträge: 1444
Registriert: 26. Jun 2004 21:18
Kontaktdaten:

#2 Beitrag von klopskuchen » 11. Apr 2006 21:31

micbur hat geschrieben:Ich würde aber gerne erst die Probleme lösen, bevor ich mit dem Einspielen von Patches anfange.
Die Tatsache das der Kernel den Inhalt der Register ausspuckt, schreit förmlich nach einem Bugreport. Allerdings wäre das Zeitverschwendung (deine und die des betreffenden Entwicklers) wenn der Fehler bereits gefixt ist.
Wenn du selbst suchen willst, $Kernelsource/Dokumentation/vm/* und im Anschluß der betreffende Quellcode. Viel Spaß. ;)
Ich würde es vorziehen den Kernel auf den neuesten Stand zu bringen (2.4.32 oder 2.4.33pre2 wenns kein 2.6er sein soll).

http://www.google.de/search?q=kswapd+%2 ... request%22

MfG, Klopskuchen
When all else fails, read the instructions .

micbur
Beiträge: 86
Registriert: 05. Jun 2004 15:55

#3 Beitrag von micbur » 11. Apr 2006 21:50

OK, dann halt anders herum.

Nun habe ich aber noch eine Frage zur Netzwerkkarte. Ich kann leider keinen Treiber für die verwendete finden. Wie kann ich sicher gehen, dass ich einen Treiber dabei habe? Immerhin ist es ein System, dass ich nur remote zur Verfügung habe. Da kann ich nicht einfach mal gegentreten und eine Knoppix-CD einlegen.

Ciao, micbur

klopskuchen
prolinux-forum-admin
Beiträge: 1444
Registriert: 26. Jun 2004 21:18
Kontaktdaten:

#4 Beitrag von klopskuchen » 11. Apr 2006 22:14

Orignal-Treiber
Bei heiklen "Könnte-mich-aussperren-bei-remote" hole ich mir ein Image nach Hause und mache Proben bis es sitzt. Das ist beim Netzwerkkartentreiber zwar auch nicht das Gelbe vom Ei, es sollte aber hinhauen wenn der im Testimage während des Bootens geladen wird (vor Initialisierung des Interfaces).


MfG, Klopskuchen
When all else fails, read the instructions .

komsomolze
Beiträge: 430
Registriert: 03. Mär 2006 23:16

#5 Beitrag von komsomolze » 12. Apr 2006 4:31

Hallo,

Einen automatischen Neustart nach ca. 5-10 Min. unter dem alten Kernel einrichten ist empfehlenswert.
Dazu einfach einen cron-job.
Unter GRUB soll es failback-Loesungen geben, falls der Kernel crasht.

Da runlevel 4 meist unbenutzt ist staende er als Minimal-Runlevel mit Netzwerk und ssh zum Testen zur Verfuegung.


EDIT: Aber vorher vielleicht erst mal nur den swap neu initialisieren, inklusive badblocks-test (Vielleicht ein Plattenschaden ?).

micbur
Beiträge: 86
Registriert: 05. Jun 2004 15:55

#6 Beitrag von micbur » 12. Apr 2006 5:58

Hallo,

PLattenschaden?! Das kann gut sein. Allerdings habe ich schon mehrfach ein Check des FS durchgeführt. Wurde auch jedes Mal was gefunden, aber ich habe mir die Sektoren nicht aufgeschrieben. Werde ich mal machen, vielleicht sind es ja immer dieselben.

Danke. Da hab' ich ja jetzt was vor ;-)
Ciao, micbur

komsomolze
Beiträge: 430
Registriert: 03. Mär 2006 23:16

#7 Beitrag von komsomolze » 12. Apr 2006 6:31

Guten Morgen,

muessen nicht dieselben sein, sowas weitet sich meist aus (wenn es das ist).

was sagt

Code: Alles auswählen

smartctl -A DEVICE
smartctl -lerror DEVICE

Antworten