Rechner bootet sich wie von Geisterhand selbst neu

Post Reply
Message
Author
friedrich
Posts: 46
Joined: 29. Jan 2002 0:46

Rechner bootet sich wie von Geisterhand selbst neu

#1 Post by friedrich »

Hallo,

ich habe ein merkwürdiges Problem mit meinem RedHat6.2-Rechner (Kernel 2.2.19 6.2.16smp) seit ein paar Tagen. Es ist ein Dual-CPU System mit Intel P3 800, 512MB Ram, IDE-Festplatte, DLink-Netzwerkkarte ..

Wie ganz von selbst bootet der Rechner manchmal aus heiterem Himmel neu, will heißen: Grade will ich noch was tippen und plötzlich sehe ich das Bios vor mir - wie wenn ich den Reset-Knopf gedrückt hätte. Ich habe die letzten Tage schon so einiges probiert. Neben dem Update auf obenstehenden Kernel der Redhat-Revision von 6.2.10 auf 6.2.16, den Reset-Button am Motherboard abzuklemmen, Netzwerkkarte, Soundkarte und alles andere unnötige rauszunehmen - immer das gleiche Ergebnis.

Weder in messages noch im kernel-logfile findet man einen Hinweis auf diesen Vorgang, lediglich halt wieder die Boot-Einträge.

Ich hatte das Problem bereits vor einigen Wochen schonmal, tauschte dann aber den Rechner gegen das exakt gleiche Modell wieder aus, sprich selbes Modell von Mainboard, CPU, RAM - lediglich ein neues Netztteil habe ich mir besorgt daß 500Watt statt wie vorher 320Watt hat.

Auffällig ist auch noch, daß es in der Regel einige Minuten bis einige Stunden dauern kann bis der Rechner von selbst wieder bootet. Wenn ich aber z.B. etwas starte, daß kurzzeitig Last verursacht ist er sofort wieder weg. So wollte ich z.B. beim Upgrade des Kernels das RPM mit den Sourcen installieren, sofort nachdem ich den Befehl eingegeben hatte, sah ich wieder das Bios.

Das System lief vorher bestimmt 1,5 Jahre ohne Probleme. Als ich die Hardware wie angesprochen vor mehreern Wochen getauscht hatte, war erstmal Ruhe mit dem Problem. Und jetzt geht es wieder los ...

Kennt jemand dieses Problem oder hat einen Hinweis für mich? Ich wäre echt dankbar.

P.S: Wenn jemand dmesg oder eine andere weitere Info benötigt schicke ich das gerne zu.

Bob Gomorrha

Re: Rechner bootet sich wie von Geisterhand selbst neu

#2 Post by Bob Gomorrha »

Mal so ein Schuss ins Blaue: alle Lüfter ok (auch Netzteil)? Drehen in die richtige Richtung? Übermässige Hitze? Hast vielleicht irgendwo durch Scheuern einen Haarriss in einem Kabel (Masse/Kurzschlus)?

Vielleicht kannst Du mit Hilfe der Blindblende ein Single-CPU-System testhalber aufstellen. Braucht die Festplatte zuviel Strom? Versuch mit einer Knoppix oder anderen Live-eval CD ein anderes System zu booten und beobachte die Ergebnisse.

User avatar
max
Posts: 806
Joined: 14. May 2000 12:55
Location: Ruhrpott

Re: Rechner bootet sich wie von Geisterhand selbst neu

#3 Post by max »

habe wenig hinzuzufügen.
Nur das:
Wenn sich wirklich nichts geändert hat, gibt es 2 Möglichkeiten:
Hardware-Defekt (worauf ich tippen würde)
oder, wenn dein System ständig online ist, vielleicht schießt dich irgendein Skript-Kiddie ab?!?
RH 6.2 ist ja nicht wirklich aktuell. (Habe ich hier aber auch laufen)
Zur Hardware fällt mir noch ein.
Der Rechner steht bestimmt klimatisiert?
Evt. durch Staub das Komponenten wärmer als sonst werden.
Mit der Zeit verhindert eine Staubschicht das Teile (RAM, Grafikkarte, usw) die passiv gekühlt werden, eine effektive Abführung der Wärme.
So das die wärmer als normal werden.
Max

friedrich
Posts: 46
Joined: 29. Jan 2002 0:46

Re: Rechner bootet sich wie von Geisterhand selbst neu

#4 Post by friedrich »

Danke für Eure Tipps.

Bezüglich einem Hardwaredefekt. Nun denn, aber das würde ja schon mit dem Teufel zugehen, wenn das jetzt schon wieder defekt wäre.

> oder, wenn dein System ständig online ist, vielleicht schießt dich irgendein Skript-Kiddie ab?!?
Ich lasse das System zwar oft die Nacht über durchlaufen, aber ich habe es auch schonmal vom Netz abgeklemmt mit demselben Fehler als Ergebnis.

> Der Rechner steht bestimmt klimatisiert?
Abgesehen von meiner Klimaanlage, die ich einschalte wenns mir zu warm ist eigentlich nicht. MEinst Du die Klimaschwankungen könnten die Hardware geschädigt haben?

Dann werd ich jetzt mal zur Tat schreiten und mir Eure Hinweise zu Herzen nehmen - danke nochmal. Wenn ich was neues habe, werde ich es hier posten, ist vielleicht für den einen oder anderen auch interessant.

bephep

Re: Rechner bootet sich wie von Geisterhand selbst neu

#5 Post by bephep »

Das gleiche Problem hatte ich auch. Bei mir ist es ein Fehler in/ auf der Platine.
Wenn das Programm beendet wird fährt der Rechner runter und schaltet er sich automatisch aus. Dabei wird von der Platine die Leitung vom ATX Netzteil auf getrennt. Jetzt habe ich die Drähte durchgeschnitten und mit einer Klemme verbunden, keine Abschaltung mehr über das Programm aber auch keine Abstürze mehr.

Carsten

Re: Rechner bootet sich wie von Geisterhand selbst neu

#6 Post by Carsten »

Was sagt die /var/log/messages oder die /var/log/syslog?

friedrich
Posts: 46
Joined: 29. Jan 2002 0:46

Re: Rechner bootet sich wie von Geisterhand selbst neu

#7 Post by friedrich »

Gar nichts, in den logs steht nicht eine Zeile darüber.

ratte

Re: Rechner bootet sich wie von Geisterhand selbst neu

#8 Post by ratte »

mit anderen worten: dem kernel bleibt keine zeit, was zu loggen -> hardware.

hm, im moment weiss ich's gar nicht genau und ausprobieren moecht' ich auch nicht ob da noch was geloggt wird, aber hast du in der lilo.conf vielleicht in der append zeile 'panic=<seconds>' stehen?

vielleicht hilft ja sowas:
<blockquote><pre><font size="1" face="">code:</font><hr><font face="Courier New" size="2">
while true; do dmesg>>dmesg.info; done
</font><hr></pre></blockquote>
in einem terminalfenster, und im anderen starteste einen prozess mit hoher last, vielleicht kriegste ja so noch ne info.

ratte

friedrich
Posts: 46
Joined: 29. Jan 2002 0:46

Re: Rechner bootet sich wie von Geisterhand selbst neu

#9 Post by friedrich »

> in der lilo.conf vielleicht in der append zeile 'panic=<seconds>'

Das habe ich jetzt mal reingesetzt, aber ändert nichts, da es ja keine Kernel-Panic ist. Aber hätte ja sein können, das ich da 0 stehen hab und er deswegen immer sofort bootet. Aber das kann ich jetzt auch ausschließen.

Tips von Bob Gomorrha
Das Temperaturproblem kann ich jetzt aber wirklich ausschließen. Ich habe das komplette System "zerlegt" und mit Druckluft aus der Dose den geringen Staubansatz entfernt. Die CPU liegt i.R. bei 32-34 Grad lt. Bios. Wegen eines anderen Betriebssystems. Ich habe mal ein altes suse 6.2 Linux installiert - dasselbe. Die Festplatte habe ich jetzt auch mal gewechselt, brachte aber auch keinen Erfolg. Ebenfalls das Netzteil, habe mir dazu extra für den Test ein Enermax Netzteil mit 500Watt besorgt. Zu Deinem Tip mit der single CPU komme ich gleich, das war interessant ;)

@bephep: Hab leider nur Bahnhof verstanden ;)

Ich war gestern der Meinung, daß es vielelicht am IDE-Controller auf dem Board liegt. Habe dann ide1 versucht und ide0 deaktiviert (alle onboard) -> selbes ergebnis. Als nächsten Schritt habe ich eine Promise IDE-Controller Karte an das System angeschlossen (ide2) -> selbes ergebnis. Der Fehler tritt vornehmlich auf, wenn ich einen Festplattencheck machen will. So reproduziere ich derzeit den Fehler am einfachsten und schnellsten. Ich unmounte ggf. eine Partition und führe ein fsck -f darauf aus. Wenn er erstmal damit begonnen hat macht er auch bis zum ende weiter. Dann wiederhole ich den Check 2-3 mal und spätestens dann macht sofort nachdem dem ab-entern des befehls wieder "beep" und ich sehe das Bios. Es passiert aber auch schonmal das ich "cd /" + TAB eintippe und schon bin ich auch wieder im Bios. Also total verwirrend.
ABER: Es scheint, als wenn das Problem nicht auftritt wenn ich einen Normalen Kernel lade, sprich ohne SMP Untersütztung. Ich bin mir zu 90% sicher, muß das aber heute nochmal ausgiebig testen.

Ich hatte zwar schon zwei Memory-Tester über das System laufen lassen, habe mir dann aber mal aus lauter Vezweiflung ;) dieses Schript besorgt: http://people.redhat.com/dledford/memtest.html
Das Script entpackt und kompiliert den Kernel mehrfach und mittels diff stellt es die Unterschiede dar. Laut dem Author habe ich ein Problem wenn ein Unterschied festgestellt wird. Nundenn, bei mir werden Unterschiede festgestellt. Inwiefern denkt ihr kann ich mich auf diese Aussage verlassen, wenn zwei Memorytester vorher keinen Fehler festgestellt haben?

friedrich
Posts: 46
Joined: 29. Jan 2002 0:46

Re: Rechner bootet sich wie von Geisterhand selbst neu

#10 Post by friedrich »

Möchte noch kurz etwas zu dem Script sagen, das ich in meinem letzten Post erwähnt habe. Ich habe mir mal die Diffs angesehen, die das Script generiert. Der wird z.B. aus einem Kommentar innerhalb einer Linux-Datei aus "becomes" "jecomes" oder im Quelltext aus "local->spy_adress<i>" ein "hocal->spy_adress<i>"

Sieht nicht gesund aus. Aber ist das dann ein RAM-Problem?

Jochen

Re: Rechner bootet sich wie von Geisterhand selbst neu

#11 Post by Jochen »

Möglich. Die veränderten Zeichen sind 4 bzw. 8 Positionen entfernt - ein einziges gekipptes Bit würde also reichen. Allerdings würde ich dann eher mal ein vermehrtes Auftreten von Segfaults erwarten und nicht einfach einen harten Reset.

Hast Du mal einen SMP-Kernel auf dem Board mit nur einem Prozessor getestet?

Jochen

hubert

Re: Rechner bootet sich wie von Geisterhand selbst neu

#12 Post by hubert »

vielleicht findest du hier noch nen tip: Linux hardware stability guide von drobbins:

http://www-106.ibm.com/developerworks/library/l-hw1/
http://www-106.ibm.com/developerworks/l ... l-hw2.html

hier werden alle erdenklichen fehlerquellen durchgegangen. das meiste davon hast du wohl bereits probiert, anderes vielleicht noch nicht. viel glück!

bephep

Re: Rechner bootet sich wie von Geisterhand selbst neu

#13 Post by bephep »

Hallo.
So, ich versuche es einmal etwas ausführlicher.
Wenn ein Rechner mit ATX Netzteil herunter fährt dann schaltet das Betriebssystem den Rechner aus.
Wenn diese Bauteil, das durch Software und den Reset und Power Taster angesteuert wird, eine Macke hat schaltet sich der Rechner im Betrieb aus.
Vom ATX Netzteil kommen zwei Leitungen die das Netzteil ansteuern. Ich habe diese beiden Leitungen durchgeschnitten und dann verbunden. Der Rechner läuft jetzt stabil, allerdings schaltet die Software Ihn nicht mehr ab. Jetzt warte ich bis sich das System herunter gefahren hat und schalte den Rechner über den Netzschalter aus.
Wenn Du aber das Board getauscht hast und das Netzteil dann ist dieser Fehler bei Dir unwahrscheinlich. Dann kann es auch an der Netzspannung liegen. Das lässt sich aber mit einfachen Mitteln nicht überprüfen. Welche weiteren Verbraucher hängen noch an dem Stromkreis ?. Versuche einmal den Rechner mit einer Verlängerungsschnur an eine andere Steckdose. möglichst nahe bei der Stromverteilung , anschliessen. Der Fehler ist ja reproduzierbar, vielleicht hilft das.
Wenn alles nicht hilft dann vielleicht doch das Netzteil brücken, man kann die Kabel so trennen das man sie hinterher wieder verbinden kann.

friedrich
Posts: 46
Joined: 29. Jan 2002 0:46

Re: Rechner bootet sich wie von Geisterhand selbst neu

#14 Post by friedrich »

Nochmals danke an Euch für die Hilfen. Die Tipps waren sehr hilfreich. Wenngleich das System nach wie vor dieselben Probleme macht.

Für die, dies interessiert:

Ich habe durch hubert's Link zur IBM Seite endlich das memtest86-Script gefunden. Der link den ich hatte war tot und so hatte ich ursprünglich ein anderes Programm verwendet, daß keinen Fehler im Ram gefunden hatte. memtest-86 hat in den ersten Minuten bereits erkannt, das mein erstes Modul etwa in der Mitte bei 62MB einen Fehler hat, ebenso wie das vierte Modul im weiteren 4 stündigen Verlauf des Tests.
Ich habe mir daraufhin zwei 128MB Module von Infineon besorgt, diese etwas über 6 Stunden mit memtest86 getestet - ohne Fehler. Jetzt erzeugt das angesprochene test.sh-Script auch keine Diffs mehr, also keine umfallenden Bits mehr. Habe daraufhin den Kernel sinnigerweise neu übersetzt, da dieser aufgrund des RAM-Problems vielleicht auch den einen oder anderen Schaden haben könnte.
Doch leider war das RAM wies aussieht nur eins der kleineren Übel. Ich habe mich dann mal wieder ans Bios gesetzt - gleich wohl es ja vorher "jahrelang" lief mit exakt diesen Einstellungen. Auch ein weiteres BIOS-Update habe ich gewagt. Kein Erfolg. Auch habe ich mal die beiden CPUs miteinander vertauscht, eine andere P3-800 CPU eingesetzt die ich hier noch habe ... all das hat leider nicht zum gewünschten Ergebnis geführt.

Zusammenfassend:
Das System läuft allem anschein nach sehr stabil wenn ich einem unicpu-kernel verwende oder einen smp-kernel mit "nosmp" starte.
Sobald ich aber im SMP-Betrieb arbeite, läßt sich der Fehler entweder sofort durch einen fsck reproduzieren oder nach einigen Momenten mit z.B. einem make -j3 bzImage um den kernel zu übersetzten. Der Rechner verhält sich dann wie gesagt exakt so, als ob ich die RESET-Taste gedrückt hätte.

Mir wird wohl nichts anderens übrig bleiben, als wieder ein neues Board zu kaufen, nur diesmal wird es sicherlich, zum dritten mal, KEIN msi mehr sein, soviel steht fest. Kann mir die beiden Denkfehler-MSI-Boards ja an die Wand hängen ;o) Oder ich versuch mich nochmal an MSI zu wenden ... oder bauen mir aus den beiden Dual-Boards mit jeweils einem Prozessor einen Cluster *g* (galgenhumor)

@bephep: Bei Deinem Problem hat sich der Rechner aber abgechaltet, nicht nur neu gebootetet oder? Finde ich im Netz eine Hilfe zu dem was Du gemacht hast, sprich wonach muß ich suchen. Bin leider kein Elektroniker ...

bephep

Re: Rechner bootet sich wie von Geisterhand selbst neu

#15 Post by bephep »

Mein Rechner hat sich nicht abgeschaltet er hat wie bei reset immer neu gebootet. Und es fing unregelmässig an und dann öfters. Nach einigen Wochen, mein Mandrake 8 hat sich immer wieder erholt , stürzte er immer bei Start ab. und damit war auch mein Linux abgestürzt.
Versuche doch mal folgendes. Der ATX Stecker vom Netzteil wird auf das Board gesteckt. Oben bezeichne ich die Seite zum Rand des Boards. Und die Ansicht ist auf das Board. Der Stecker hat zwei Reihen eine linke und eine rechte. Die beiden Drähte sind auf der echten Seite, und von unten gesehen die dritten und vierten, Bei mir sind die Farben schwarz und grün. Diese beiden Leitungen schalten das Netzteil ein wenn sie verbunden sind. Es sind dünne Leitungen weil sie keinen hohen Strom haben. Diese Leitungen so durchschneiden das man sie wieder verbinden kann. Wenn die Leitungen durchgeschnitten sind solltest Du versuchen den Rechner zu starten. er darf dann nicht mehr starten. Dann die beiden Enden die vom Netzteil kommen verbinden. Jetzt muss der Rechner starten.Es ist kein Power on/off mehr möglich auch reset geht nicht mehr.
Hilfe im Netz, keine Ahnung . Ich habe die Beschaltung des Netzteils aus einer CT.Und dann gesucht.

Post Reply