DMA timeout

Post Reply
Message
Author
joerch
Posts: 5
Joined: 12. Jul 2004 7:50

DMA timeout

#1 Post by joerch »

Hallo,

Dies ist mein erstes Posting und ich komme direkt mit einem Problem daher.

Ich habe Fedora Core 2 installiert und habe Probleme mit einer Festplatte:

Die Platte ist eine 250GB Western Digital mit 8MB. Da mein Mutterbrett aber keine Platten mit dieser größe erkennt, habe ich ein Promise IDE Kontroller eingebaut (Ultra 100). Auf der Platte befindet sich ein Samba-Share Verzeichnis. Wenn ich über eine XP-Client Daten auf diese Platte verschiebe bekomme ich nach einiger Zeit eine Fehlermeldung mit dem Hinweis "Netzwerkressource nicht verfügbar". Also habe ich auf einer anderen Platte auch eine Share-Verzeichnis angelegt und die gleichen Daten dort hin kopiert, ohne Fehler. Dann habe ich die Daten auf dem Server von der einen Platte auf die andere kopiert und das hat sehr lange gedauert.

Dann habe ich mir das System.Log angeschaut und folgende Einträge gefunden:

Jul 10 23:46:34 familix kernel: hdf: dma_timer_expiry: dma status == 0x40
Jul 10 23:46:34 familix kernel: hdf: DMA timeout retry
Jul 10 23:46:34 familix kernel: PDC202XX: Primary channel reset.
Jul 10 23:46:34 familix kernel: PDC202XX: Secondary channel reset.
Jul 10 23:46:34 familix kernel: hdf: timeout waiting for DMA
Jul 10 23:46:54 familix kernel: hdf: dma_timer_expiry: dma status == 0x40
Jul 10 23:46:54 familix kernel: hdf: DMA timeout retry
Jul 10 23:46:54 familix kernel: PDC202XX: Primary channel reset.
Jul 10 23:46:54 familix kernel: PDC202XX: Secondary channel reset.
Jul 10 23:46:54 familix kernel: hdf: timeout waiting for DMA
Jul 10 23:47:14 familix kernel: hdf: dma_timer_expiry: dma status == 0x40
Jul 10 23:47:14 familix kernel: hdf: DMA timeout retry
Jul 10 23:47:14 familix kernel: PDC202XX: Primary channel reset.
Jul 10 23:47:14 familix kernel: PDC202XX: Secondary channel reset.
Jul 10 23:47:14 familix kernel: hdf: timeout waiting for DMA
Jul 10 23:47:35 familix kernel: hdf: dma_timer_expiry: dma status == 0x40
Jul 10 23:47:35 familix kernel: hdf: DMA timeout retry
Jul 10 23:47:35 familix kernel: PDC202XX: Primary channel reset.
Jul 10 23:47:35 familix kernel: PDC202XX: Secondary channel reset.
Jul 10 23:47:35 familix kernel: hdf: timeout waiting for DMA
Jul 10 23:47:54 familix kernel: spurious 8259A interrupt: IRQ7.


Das ganze ist deshalb sehr merkwürdig, das unter Fedora-Core 1 (Kernel 2.4) nicht zu so einem Problem gekommen ist. Ich habe die Platte und den Controller mal in einen anderen Rechner eingebaut (mit Fedora Core 2) und bekam die gleiche Meldung (Netzwerkressource ...).

Habt Ihr einen Rat für mich?

Gruss

Joerch

User avatar
hjb
Pro-Linux
Posts: 3264
Joined: 15. Aug 1999 16:59
Location: Bruchsal
Contact:

#2 Post by hjb »

Hi,

außer "Ausfall der Festplatte" fällt mir dazu nichts ein. Gerade ganz frische Platten fallen gern aus. Lies mal die SMART-Werte der Platte.

Gruß,
hjb
Pro-Linux - warum durch Fenster steigen, wenn es eine Tür gibt?

joerch
Posts: 5
Joined: 12. Jul 2004 7:50

smartctl liefert folgendes Ergebnis

#3 Post by joerch »

Code: Select all

=== START OF INFORMATION SECTION ===
Device Model:     WDC WD2500JB-00EVA0
Serial Number:    WD-WMAEH2433225
Firmware Version: 15.05R15
Device is:        Not in smartctl database [for details use: -P showall]
ATA Version is:   6
ATA Standard is:  Exact ATA specification draft version not indicated
Local Time is:    Mon Jul 12 23:45:32 2004 CEST
SMART support is: Available - device has SMART capability.
SMART support is: Enabled
 
=== START OF READ SMART DATA SECTION ===
SMART overall-health self-assessment test result: PASSED
 
General SMART Values:
Offline data collection status:  (0x82) Offline data collection activity was
                                        completed without error.
                                        Auto Offline Data Collection: Enabled.
Self-test execution status:      (   0) The previous self-test routine completed                                        without error or no self-test has ever
                                        been run.
Total time to complete Offline
data collection:                 (7599) seconds.
Offline data collection
capabilities:                    (0x79) SMART execute Offline immediate.
                                        No Auto Offline data collection support.                                        Suspend Offline collection upon new
                                        command.
                                        Offline surface scan supported.
                                        Self-test supported.
                                        Conveyance Self-test supported.
                                        Selective Self-test supported.
SMART capabilities:            (0x0003) Saves SMART data before entering
                                        power-saving mode.
                                        Supports SMART auto save timer.
Error logging capability:        (0x01) Error logging supported.
                                        No General Purpose Logging support.
Short self-test routine
recommended polling time:        (   2) minutes.
Extended self-test routine
recommended polling time:        (  95) minutes.
Conveyance self-test routine
recommended polling time:        (   5) minutes.
 
SMART Attributes Data Structure revision number: 16
Vendor Specific SMART Attributes with Thresholds:
ID# ATTRIBUTE_NAME          FLAG     VALUE WORST THRESH TYPE      UPDATED  WHEN_FAILED RAW_VALUE
  1 Raw_Read_Error_Rate     0x000b   200   200   051    Pre-fail  Always       -       0
  3 Spin_Up_Time            0x0007   125   124   021    Pre-fail  Always       -       4283
  4 Start_Stop_Count        0x0032   100   100   040    Old_age   Always       -       236
  5 Reallocated_Sector_Ct   0x0033   200   200   140    Pre-fail  Always       -       0
  7 Seek_Error_Rate         0x000b   200   200   051    Pre-fail  Always       -       0
  9 Power_On_Hours          0x0032   100   100   000    Old_age   Always       -       521
 10 Spin_Retry_Count        0x0013   100   100   051    Pre-fail  Always       -       0
 11 Calibration_Retry_Count 0x0013   100   100   051    Pre-fail  Always       -       0
 12 Power_Cycle_Count       0x0032   100   100   000    Old_age   Always       -       223
194 Temperature_Celsius     0x0022   127   253   000    Old_age   Always       -       23
196 Reallocated_Event_Count 0x0032   200   200   000    Old_age   Always       -       0
197 Current_Pending_Sector  0x0012   200   200   000    Old_age   Always       -       0
198 Offline_Uncorrectable   0x0012   200   200   000    Old_age   Always       -       0
199 UDMA_CRC_Error_Count    0x000a   200   253   000    Old_age   Always       -       0
200 Multi_Zone_Error_Rate   0x0009   200   155   051    Pre-fail  Offline      -       0
 
SMART Error Log Version: 1
No Errors Logged
 
SMART Self-test log structure revision number 1
No self-tests have been logged.  [Use the smartctl -t option to run these.]

joerch
Posts: 5
Joined: 12. Jul 2004 7:50

Kernel-Fehler

#4 Post by joerch »

Hi!

Habe diesen Thread bei http://www.kerneltrap.org gefunden.

Habe den Patch aber noch nicht ausprobiert!!

Gruss

Joerch

buhmann

#5 Post by buhmann »

2 ursachen, entweder fehler mit dma oder festplattenfehler. passiert hier und da mal.

joerch
Posts: 5
Joined: 12. Jul 2004 7:50

Re: DMA timeout

#6 Post by joerch »

Hier ist die Lösung für mein Problem:

Code: Select all

--- linux-2.6.7/drivers/ide/ide-probe.c 2004-06-21 15:25:51.000000000 +0200
+++ linux/drivers/ide/ide-probe.c 2004-06-21 15:29:19.901710936 +0200
@@ -897,7 +897,7 @@
blk_queue_segment_boundary(q, 0xffff);

if (!hwif->rqsize)
- hwif->rqsize = hwif->no_lba48 ? 256 : 65536;
+ hwif->rqsize = 256;
if &#40;hwif->rqsize < max_sectors&#41;
max_sectors = hwif->rqsize;
blk_queue_max_sectors&#40;q, max_sectors&#41;;

Post Reply