raid ist plötzlich verschwunden! aber wohin?

Post Reply
Message
Author
alt-f4
Posts: 6
Joined: 26. Jun 2007 10:10
Location: Bonn

raid ist plötzlich verschwunden! aber wohin?

#1 Post by alt-f4 »

hi an alle, die hoffentlich nicht von dem vielen Text abgeschreckt werden. 8-)

ich weiss nicht so recht, ob das nun inst "software"- oder "hardware"-forum gehört, ich habe mich kurzerhand für "hardware" entschieden...

habe folgendes Disaster hier:

Ein altes Epox EP-8KTA3+PRO Mainboard (I386 KT-133A K7, Award Bios v6.00PG) (mit Onboard Highpoint 370/372 v2.32 IDE-Raid)

Daran angeschlossen:
- 3 Maxtor WD250 IDE Platten. (1 IDE Kabel (ATA100/133) am Gelben UIDE2 Anschluss mit einer Platte (gejumpert als Master), und 1 IDE Kabel (ATA100/133) am UIDE1 Anschluss mit zwei Platten als "Master w/ Slave present" und "Slave"
- Ein IDE DVD-ROM-Laufwerk am IDE2.

Am äußersten PCI-Slot ein externer Adaptec SCSI-Controller an welchen eine 34GB SCSI Disk angeschlossen ist, von der ein Debian 4.0 (oder war es 3.irgendwas?) gebootet wird. Die 3 IDE Platten dien(t)en nur als Ablageort (via Samba).

Prozessor: AMD Athlon mit 1GHz
USB 1.0 Schnittstelle.
und 1GB Ram.

Also schon alles etwas betagt.


Die Kiste lief nie lange Zeit am Stück, weil sie mir nur als Ablagekiste dient(e), nun aber gar nicht mehr.
Habe irgendwann, weil irgendetwas mucken machte, auf Debian 4.0 upgegraded.
Leider auch an der HW "rumgerüttelt", so das ich nun nicht mehr weiss, wie die ganzen Stecker vorher gesteckt waren :,-(

Aber lt. Gedächnis 3.11[tm] lief die Kiste *entweder* mit dem Hardware-IDE-Raid (die 3 Platten zusammengeführt als Stripeset = 750GB)
oder mit einem Linux Softraid. (Auch als Stripeset oder als Raid 5 (2 Platten aktiv, eine als Spare = 500GB)).
Oder beides... ;-/
Ich weiss es wirklich nicht mehr und das ist nun mein Verhängnis, denn vor 2 Monaten hab ich das letzte Backup gemacht und seit dem sind 10GB an Nutzdaten hinzugekommen, die natürlich nicht auf der externen Backupplatte sind.

Debian empfängt mich nun neuerdings nicht mehr mit einem Loginprompt, den ich kenne, sondern mit soetwas:

Code: Select all

(...)
raid: using function: p5_mmx (3532.000 MB/sec)
md: md driver 0.90.3 MAX_MD_DEVS=256, MD_SB_DISKS=27
md: bitmap version 4.39
(...)
md: raid6 personalit registered for level 6
md: raid5 personalit registered for level 5
md: raid4 personalit registered for level 4
(...)
Success: loaded module raid456
Done.
Begin: Assembling all MD arrays
md: md0 stopped.
attempt to access beyond end of device
hdg: rw=0, want 2147616456, limit=488397168
(...) hiervon sehr viel und immer wieder.
attempt to access beyond end of device
hdg: rw=0, want 2147616638, limit=488397168
attempt to access beyond end of device
hdg: rw=0, want 2147616639, limit=488397168

raid5: raid level 5 set md0 active with 3 out of 3 devices.

RAID5 conf printout:
--- rd:3 wd:3 fd:0
disk 0, o:1, dev:hde
disk 1, o:1, dev:hdf
disk 2, o:1, dev:hdg

mdadm: /dev/md0 has been started mit 3 drives.
Success: assembled all arrays.
Done.
(...)
/init: /init: 1: cannot open /dev/root: No such device or address
Begin: Running /scripts/local-premount ...
Done
Usage: modprobe [-v] (...)
mount: Cannot read /etc/fstab: No such file or directory
(...)
Target filesystem doesn't have /sbin/init

BusyBox v1.1.3 (Debian 1:1.1.3-4) Built-in shell (ash)
(enter 'help' for a list of built in commands)

/bin/sh: can't access tty; job controll turned off
(initramfs)

Ich weiss nicht, was passiert ist. Die Kiste wurde immer ordnungsgemäß runtergefahren.
Debian findet irgendwie garnix mehr, warum weiss ich nicht. Ich hätte Euch gerne noch mehr abgetippt, aber meine Finger zittern genauso, wie meine Stirn schwitzt :-)

Ich habe die Vermutung, das das HW-Raid vielleicht seine Konfiguration vergessen hat? Aber das würde mit den 3 konfigurierten Platten für das Softwareraid kollidieren, oder? Ich finde auch im Netz nirgens etwas, was mir eine Idee gibt, als welches Device z.b. Das HW-Raid unter Debian erkannt werden könnte. Also /dev/md0 sind ja die Softwareraids, oder? und /dev/hdX die eingebauten Platten. Aber auch, wenn sie vorher von Bios des Raidcontrollers zusammengeführt wurden? hmmm...

Ich weiss, wenn man vergesslich ist, soll man später nicht rumheulen, aber welche möglichkeiten habe ich denn nun noch, um an die Daten zu gelangen?
Sofern es keine Hardwaredefekte sind, müsste das ja möglich sein, mit Mitteln, die ich (noch) nicht kenne.
Habe schon viel versucht und gelesen, aber mein Wissen reicht nicht wirklich aus, deswegen dieser öffentliche Hilferuf!

Boote ich mit Knoppix v4 oder v5 (#knoppix 2 dma), und gucke mir die Platten mit cfdisk an, bekomme ich foldendes:
(cfdisk 2.12p)

Code: Select all


#cfdisk /dev/hde
Part. Typ Dateisystemtyp [Bezeichner] Größe (MB)
-------------------------------------------------------------------------------------------
Pri/Log Freier Bereich 250056,74

Code: Select all


#cfdisk /dev/hdf
Unbekannter Partitionstabellentyp
Möchten Sie mit einer Null-Tabelle beginnen [j/N]

Code: Select all


#cfdisk /dev/hdg
FATALER FEHLER: Beschädigte primäre Partition 2: Partition fängt hinter dem Ende der Festplatte an
Eine Taste drücken, um cfdisk zu beenden

tja, und mit fdisk -l

Code: Select all


#fdisk -l /dev/hde
Platte /dev/hde: 250.0 GByte, 250059350016 Byte
255 Köpfe, 63 Sektoren/Spuren, 30401 Zylinder
Einheiten = Zylinder von 16065 × 512 = 8225280 Bytes

Gerät boot. Anfang Ende Blöcke Id System

Code: Select all


#fdisk -l /dev/hdf

Platte /dev/hdf: 250.0 GByte, 250059350016 Byte
255 Köpfe, 63 Sektoren/Spuren, 30401 Zylinder
Einheiten = Zylinder von 16065 × 512 = 8225280 Bytes

Festplatte /dev/hdf enthält keine gültige Partitionstabelle

Code: Select all


#fdisk -l /dev/hdg

Platte /dev/hdg: 250.0 GByte, 250059350016 Byte
4 Köpfe, 1 Sektoren/Spuren, 122099292 Zylinder
Einheiten = Zylinder von 4 × 512 = 2048 Bytes

Gerät boot. Anfang Ende Blöcke Id System
/dev/hdg1 33010 33252 483+ c7 Syrinx
/dev/hdg2 1 1 0 0 Leer
Partition 2 endet nicht an einer Zylindergrenze.
/dev/hdg3 536903922 536904164 483+ c7 Syrinx
/dev/hdg4 1 1 0 0 Leer
Partition 4 endet nicht an einer Zylindergrenze.
root@0[~]#

Das sagt mir alles nichts (bzw. macht es mir angst), allerdings wundere ich mich, das *wenn* ich doch ein Softwareraid benutzt hatte, das keine der Platten ein "FD Linux raid autodetect" als Dateisystemtyp hat. (Als Dateisystem auf dem Raid hatte ich ext3)

Das 3 Platten gleichzeitig explodieren, scheint mir nicht folgerichtig geschlussfolgert. Deswegen meine ich, könnte es ja mit dem mischmasch an HW-Raid und SW-Raid zu tun haben?
Ach, wenn ich wüsste, was ich meinen soll.
Früher standen z.B. auch Meldungen im Syslog, das irgendetwas OUT OF RANGE ist, oder so. Also Debian hatte immer Probleme mit den Platten oder der Plattengröße.

Die 3 Platten wurden nun schon so oft umgesteckt, das ich die original (Steck)reihenfolge nicht mehr weiss. Ich versuchte mich an der Beschriftung aus einer gebackupt'en fstab zu orientieren, aber auch das half nicht wirklich um plötzlich wieder ein laufendes System zu haben. Die Kabel an sich sind schon richtig gesteckt (Blau=Board, Schwarz=Master, Grau=Slave) und auch schon mal ausgetauscht um defekte Kabel auszuschliessen).
Weder das Highpoint Bios, noch Debian hat bei irgendeiner Steckvariante irgendetwas positives gezeigt. Ich dachte, das wenn ich die Platten evtl. wieder richtig stecke, dann zeigt mir der Highpoint auch wieder das HW-Raid an. (Sofern es denn vorher da war)

Falls ihr irgendein Tool kennt, das ich probieren könnte um an die ursprüngliche Konfiguration zu kommen, oder zu erkennen, ob die Platten alle in einem HW-Raid-Verbung gesteckt haben, wäre ich für jeden Hinweis dankbar. Ich glaube nicht, das die Daten futsch sind, aber dran komme ich auch nicht mit meinen bescheidenen Kenntnissen über die Boardmittel nicht mehr.

Jeder Tipp zwex weiterer Analyse ist wI'llkommen. Wenn ich Euch noch irgendwelche Infos vorenthalten habe, so sagt mir bitte, wie ich vorgehen muss, um Euch diese zukommmen zu lassen.

auf konstruktive Hilfe hoffend,

alt-f4 (das rat ich dir!) :-)

User avatar
Janka
Posts: 3585
Joined: 11. Feb 2006 19:10

#2 Post by Janka »

Etwas Futter zum Nachdenken für dich:

* Das EPoX 8KTA3+ besitzt keinen HW-RAID-Controller. Ein HW-Raid-Controller hat Anschlüsse für mehrere Platten und verhält sich zur CPU-Seite hin wie eine einzelne Platte. Narrensicher und schnell, aber teuer. Das EPoX-Board hat einen HPT370-Controller. Das ist ein BIOS-Raid, also ein normaler IDE-Plattencontroller sowie eine BIOS-Erweiterung, um Platten spiegeln zu können. Das eigentliche Raid wird immer per Software gemacht, entweder über die BIOS-Aufrufe (DOS, MS-Windows 3.x z.B.) oder über einen Treiber (MS-Windows NT, Linux).

* Du hast angeblich ein Raid 5 auf den IDE-Platten. Der HPT370 kann aber nur Raid0,1 und 10 sowie JBOD => Dein Raid ist ein Linux-Multi-Device ohne Anbindung an die BIOS-Konfiguration => Die BIOS-Raid-Konfiguration ist egal.

* Du bootest angeblich von einer SCSI-Platte. Also zieh' mal alle Datenplatten ab, und gucke nach, ob du überhaupt booten kannst. Wenn nicht, solltest du mal im Advanced BIOS Setup die Bootreihenfolge prüfen. Insbesondere "SCSI or Raid boot" sollte auf "SCSI" stehen.

Janka
Ich vertonne Spam immer in /dev/dsp statt /dev/null.
Ich mag die Schreie.

alt-f4
Posts: 6
Joined: 26. Jun 2007 10:10
Location: Bonn

#3 Post by alt-f4 »

Ersma vielen Dank für das Kraftfutter. Nach dem hoffenltichen erfolgreichen Verdauen kann ich Dir dies schreiben:
Janka wrote:* Das EPoX 8KTA3+ besitzt keinen HW-RAID-Controller. Ein HW-Raid-Controller hat Anschlüsse für mehrere Platten und verhält sich zur CPU-Seite hin wie eine einzelne Platte. Narrensicher und schnell, aber teuer. Das EPoX-Board hat einen HPT370-Controller. Das ist ein BIOS-Raid, also ein normaler IDE-Plattencontroller sowie eine BIOS-Erweiterung, um Platten spiegeln zu können. Das eigentliche Raid wird immer per Software gemacht, entweder über die BIOS-Aufrufe (DOS, MS-Windows 3.x z.B.) oder über einen Treiber (MS-Windows NT, Linux).
Alles klar, dann hatte ich mich missverständlich ausgedrückt, weil ich nicht wirklich wusste, wovon ich spreche :-)
Janka wrote:* Du hast angeblich ein Raid 5 auf den IDE-Platten. Der HPT370 kann aber nur Raid0,1 und 10 sowie JBOD => Dein Raid ist ein Linux-Multi-Device ohne Anbindung an die BIOS-Konfiguration => Die BIOS-Raid-Konfiguration ist egal.
D.h. wohl, ich habe in dem HW-Raid-Controller des Mainboards also nur Rumgespielt und nichts verändert oder kaputt gemacht. Ich erinner mich auch, das ich mal vor längerer Zeit, alle 3 IDE-Platten zu einem Stripeset zusammengefügt habe um zu gucken, was passiert.
Normalerweise habe ich bis dato auch immer Raid5 bei Software-Raids verwendet.
Und wenn es so zu erkennen ist und somit also in der Konfiguration stehen muss, und ich auf die Daten zugreifen konnte, bis auf den Tag, als mich der (initramfs) Prompt empfing, ist die weitere Fehlersuche wohl auf die Software (mdadm und Konsorten?) zu beschränken.
Janka wrote:* Du bootest angeblich von einer SCSI-Platte. Also zieh' mal alle Datenplatten ab, und gucke nach, ob du überhaupt booten kannst. Wenn nicht, solltest du mal im Advanced BIOS Setup die Bootreihenfolge prüfen. Insbesondere "SCSI or Raid boot" sollte auf "SCSI" stehen.
In der Tat bootet der Rechner von einer SCSI-Platte. Stecke ich die IDE-Platten ab (das CD-Rom erstmal nicht) ändert sich nichts an dem Verhalten des bootenden Systems, ausser das die IDE-Fehlermeldungen/-Warnungen ausbleiben.
Debian empfängt mich mit einem (initramfs) Prompt.

Ich persönlich bin, bis auf den ersten Punkt, noch genau so (un)schlau wie vorher und wüsste nicht, wo ich jetzt weiter ansetzten sollte.
Hoffentlich gibts bald wieder Futter ;-)

User avatar
Janka
Posts: 3585
Joined: 11. Feb 2006 19:10

#4 Post by Janka »

Gut. Also klappt das Booten von SCSI schon nicht. Da du bis in die initrd hineinkommst, solltest du mal die Kernelmeldungen untersuchen, ob der SCSI-Controller vom Kernel überhaupt gefunden werden kann. Evtl. fehlt nach einem Kernelupdate einfach der (zuvor fest einkompilierte) Treiber.

Janka
Ich vertonne Spam immer in /dev/dsp statt /dev/null.
Ich mag die Schreie.

alt-f4
Posts: 6
Joined: 26. Jun 2007 10:10
Location: Bonn

#5 Post by alt-f4 »

Janka wrote:Da du bis in die initrd hineinkommst, solltest du mal die Kernelmeldungen untersuchen, ob der SCSI-Controller vom Kernel überhaupt gefunden werden kann.
aha, danke f.d. info. ich hab garkeine benachrichtigung bekommen für diesen hinweis und deswegen lese ich das erst jetzt. sorry. werde mich die tage mal dransetzen!

alt-f4
Posts: 6
Joined: 26. Jun 2007 10:10
Location: Bonn

das wars dann...

#6 Post by alt-f4 »

habe viel versucht und auch menschen, die vor jahren mit slackware angefangen haben an die kiste gelassen. leider war alles nicht erfolgreich, so das ich das projekt "datenrettung" abgeschlossen habe. schade auch :-)
trotzdem danke janka. wenn auch wat spät...

Post Reply