RAM wahrscheinlich Defekt; Memtest findet keine Fehler

Post Reply
Message
Author
Gast_Daniel

RAM wahrscheinlich Defekt; Memtest findet keine Fehler

#1 Post by Gast_Daniel »

Hallo Leute,

habe in meinem neuen Linux-System wahrscheinlich defekten RAM verbaut und hoffe auf Eure Hilfe!

Die Symptome: Downloade ich Dateien per http (z.B. wget, apt-get) aus dem Netz oder auch LAN ist bei einer 1MB großen Testdatei reproduzierbar mit hoher Wahrscheinlichkeit (>>50%) mindestens 1 Bit gekippt. Bei einer Stichprobe mit einer 8,6MB ASCII-TXT-Datei war unter 20 gekippten Bits immer das dritte Bit eines Bytes und dieses immer von 1 zu 0 gekippt (also statt einem 'e' ein 'a', statt 'u' ein 'q'...).

Als Bestriebssystem läuft Ubuntu 8.10 AMD64 (2.6.27-7-generic bzw 2.6.27-11-generic, sowohl installiertes Ubuntu, als auch das direkt von Live-CD).

System besteht u.A. aus folgenden Teilen:
Mainboard: AsRock K10N78FullHD-hSLI R3.0
CPU: Athlon 4850e
RAM: takeMS DIMM 4 GB DDR2-800 Kit (2x2GB)
GPU: GF 8200 onboard
Festplatte: WD10EADS 1 TB


Auf der Suche nach dem genauen Fehler hab ich unter anderem folgendes gemacht:
- Memtest86 v2.01 sieben Stunden durchlaufen lassen (=4 Läufe) -> keine Fehler gefunden
- die beiden Riegel von Bank 1/2 in Bank 3/4 gesteckt -> nach wie vor fehlerhafte Downloads
- nur Riegel1 eingebaut -> keine fehlerhaften Downloads mehr
- nur Riegel2 eingebaut -> ebenso keine fehlerhaften Downloads mehr
- wieder beide Riegel eingebaut, aber in anderer Reihenfolge -> keine fehlerhaften Downloads mehr
- wieder ursprüngliche Reihenfolge der beiden Riegel -> ja, da sind die Fehler wieder beim Download
- im Bios den Speicher von ursprünglich DDR800 auf DDR400 (das niedrigst mögliche) gestellt, alle Timings auf max (also die langsamsten Einstellungen) -> weiterhin Fehler beim Download
- Spannung von 1,8V auf 1,9V erhöht -> ...
- mit dem untertakteten Speicher nochmals Memtest86 >5 Std (=3 Läufe) laufen lassen -> keine Fehler gefunden
- Speicher komplett gegen ein bewährtes Paar eines anderen Rechners getauscht -> keine fehlerhaften Downloads mehr

Nur am Rande, vll ists ja wichtig: Etwas kurios ist, dass die Probleme meist nur dann auftreten, während keine Gnome-Session läuft. Während einer solchen Session kommt es nur sehr selten zu fehlerhaften Downloads (passiert aber dennoch). Beende ich die Gnome-Session, gibts wieder gewohnt viele fehlerhafte Downloads. Der NetworkManager scheint aber aber keinen Einfluss zu haben (deaktiviert).


Dass es am RAM liegt scheint zu 99,9% sicher und bis auf Memtest deutet alles widerspruchsfrei darauf hin. Dass Memtest den Fehler nicht findet stört mich aber irgendwie.

Weiß jemand, wie man unter Linux herausfindet, welche Bereiche des RAMs innerhalb einer gewissen Zeitspanne genutzt wurden, um diese anschließend genauer mit Memtest unter die Lupe zu nehmen? Eine Idee dazu wäre vll, per Ausschlussverfahren eine Ramdisk (ramfs) zu erstellen und diese mit Dummydaten zu füllen; dieser Speicherbereich müsste dann nicht mit Memtest getestet werden - aber dazu müsste man den genauen RAM-Bereich der RAM-Disk wissen (wie?). Oder Linux beim Starten anweisen, nur bestimmte Teile des RAMs zu nutzen (wie?).
Hat sonst vielleicht jemand ne Idee dazu? Könnte der fehlerhafte Bereich, der anscheinend von der Netzwerkkarte benutzt wird zufällig genau innerhalb des von Memtest selbst genutzten Speicherbereichs liegen?

Vielen Dank schon mal an alle, die sich mit dem Thema auseinandersetzen,

Daniel

petameta
prolinux-forum-admin
Posts: 1294
Joined: 14. Feb 2003 13:19

#2 Post by petameta »

Daß Memtest keine Fehler findet, heißt nicht, daß der RAM OK ist, aber das hast Du ja schon selber festgestellt.

Bei den aktuellen RAM-Preisen, hau das Zeug weg und bau neuen RAM ein, die Mühe ist es nicht wert.

Sego

#3 Post by Sego »

Moin,

habe es auch schon gesehen, das zwei Riegel sich "nicht mochten". Symtome waren ähnlich deinen, auch sie liefen einzeln tadellos und zusammen nicht. Hat man sie einzeln voneinander mit einem dritten Riegel laufen lassen ging es auch.... Keine Ahnung was dahinter steckte.,,

Gast_Daniel

#4 Post by Gast_Daniel »

vielen Dank Euch beiden für Eure Antworten.

@petameta:
Finanziell lohnt es sicherlich nicht, da hast Du Recht - zumal ich noch 10 Tage meines 14tägigen Rückgaberechts habe. Aber vielleicht kann ich bei der Gelegenheit ja etwas mehr über meinen PC und Linux lernen, was dann doch lohnenswert wäre.

@Sego:
Super Idee, da bin ich noch gar nicht drauf gekommen: Hab grad in zwei Durchgängen jeweils einen der vermeintlich defekten Speicherriegel durch einen dritten, ziemlich sicher funktionstüchtigen Speicherriegel getauscht. Voila: Es ist definitiv der erste Riegel, der Ärger macht. Was natürlich nicht aussagt, dass der zweite in Ordnung ist.

Vielleicht kann mir ja noch jemand sagen, ...:
- ob es unter Linux möglich ist, zu sehen, welche Bereiche des RAMs grade belegt sind
- und wie man den Kernel beim Starten anweist, nur einen Teil des RAMs zu nutzen

Vielen Dank,

Daniel

User avatar
Janka
Posts: 3585
Joined: 11. Feb 2006 19:10

#5 Post by Janka »

Gast_Daniel wrote: Vielleicht kann mir ja noch jemand sagen, ...:
- ob es unter Linux möglich ist, zu sehen, welche Bereiche des RAMs grade belegt sind
- und wie man den Kernel beim Starten anweist, nur einen Teil des RAMs zu nutzen
Geht mit einem Patch. Guck hier.
http://rick.vanrein.org/linux/badram/
Janka
Ich vertonne Spam immer in /dev/dsp statt /dev/null.
Ich mag die Schreie.

komsomolze
Posts: 430
Joined: 03. Mar 2006 23:16

#6 Post by komsomolze »

- und wie man den Kernel beim Starten anweist, nur einen Teil des RAMs zu nutzen
Auch Parameter mem=


Den Speicher kannst Du auch "händisch" testen:
- tmpfs auch nach /tmp mounten

Code: Select all

$ df -m | grep tmp
tmpfs                     1014         0      1014   0% /lib/init/rw
tmpfs                     1014         0      1014   0% /dev/shm
tmpfs                     1014         1      1014   1% /tmp
dd if=/dev/zero of=...../NULL$i bs=1M count=50
Die Dateien können aber auch aus etwas anderem als 0x00 bestehen.

Mit ein wenig Spielerei ist es möglich, den RAM zu belegen, ohne daß ausgelagert wird und die gecachte Menge klein bleibt (-> free):
- die einzeln kopierten Dateien NULL* kleiner wählen.
- evtl. swappiness kleiner stellen.
- SWAP mit swapoff abschalten, das System könnte dann aber einfrieren.

Dann kanst Du die MD5-Summen der NULL* vergleichen.


Oder eine Datei kopieren, wobei annähernd der Speicher als Cache ausgenutzt wird (wiederum sollte dabei nicht der SWAP benutzt werden -> free).
Eine weitere Kopie erfolgt dann aus dem Cache und sollte bei "gutem" RAM die MD5-Summe der Ursprungsdatei haben.
mfg komsomolze

volltroll.de
Posts: 2
Joined: 17. Jun 2009 8:52

#7 Post by volltroll.de »

Wie gut lässt es sich bei Dir reproduzieren? Immer wenn Du ne kleine Datei runterlädst?

Ich habe ähnliche Probleme mit nem AsRoch 780FullHD und Kingstonspeicher (speicherset 2x2GB).
Habe des öfteren Segfaults bekommen, aber Memtest zeigt hier auch keine Fehler. Wobei Memtest anscheinend die SPeicherconfig nicht richtig auslesen kann, da es 200MHz anzeigt beim takt, der aber auf 400 gestellt wurde.
Ich habe jetzt dei Spannung mal auf 1.9V gesetzt (2.2VModul) und mal schauen obs nun geht.

haha

sowas

#8 Post by haha »

Sowas Ähnliches hatte ich auch mal... war irgendwie ein defekter via-chip -> Board getauscht ;)

Post Reply