Umlaute und korrekte Umwandlung ISO -> UTF-8

Post Reply
Message
Author
rolle
Posts: 1
Joined: 11. Jan 2007 21:32

Umlaute und korrekte Umwandlung ISO -> UTF-8

#1 Post by rolle »

Hallo,

ich bin von Win98SE kürzlich auf Linux Mandriva 2007.0 umgestiegen, muss aber meine antiquierte Win98SE-Installation noch gelegentlich nutzen. Da ich häufiger Daten austauschen muss, kann ich von Linux aus auf die Win98-Partition zugreifen. Textdateien werden dabei automatisch von ISO8859 in UTF-8 umgewandelt, allerdings nicht ganz korrekt: Zeilenumbrüche werden korrekt umgewandelt, Umlaute und ß nicht vollständig: KWrite und Netbeans zeigen seltsame Zeichen an.

Mit

iconv -f ISO8859-1 -t UTF8 windatei linuxdatei

kann ich die ursprünglichen ISO-Dateien von Hand korrekt in UTF umwandeln. Die automatische Umwandlung erzeugt dagegen Ergebnisse, wie sie

iconv -t UTF8 windatei linuxdatei

erzeugt. Natürlich könnte ich die Umwandlung jeweils per Hand oder Skript durchführen, doch es müsste doch möglich sein, eine korrekte Umwandlung zu erzwingen?

/etc/fstab sieht so aus:

/dev/hda5 / ext3 defaults 1 1
/dev/hdc /mnt/cdrom auto umask=0,users,noauto,ro,exec 0 0
/dev/fd0 /mnt/floppy auto umask=0,users,sync,noauto,exec 0 0
/dev/hdb1 /mnt/windows vfat umask=0,users 0 0
none /proc proc defaults 0 0
/dev/hda6 swap swap defaults 0 0

locale gibt dies aus:

LANG=de_DE.UTF-8
LC_CTYPE=de_DE.UTF-8
LC_NUMERIC=de_DE.UTF-8
LC_TIME=de_DE.UTF-8
LC_COLLATE=de_DE.UTF-8
LC_MONETARY=de_DE.UTF-8
LC_MESSAGES=de_DE.UTF-8
LC_PAPER=de_DE.UTF-8
LC_NAME=de_DE.UTF-8
LC_ADDRESS=de_DE.UTF-8
LC_TELEPHONE=de_DE.UTF-8
LC_MEASUREMENT=de_DE.UTF-8
LC_IDENTIFICATION=de_DE.UTF-8
LC_ALL=


Eine Änderung von LANG auf de_DE oder auf de_DE.EURO brachte keine Verbesserung.

Hat jemand eine Idee?

Danke!

User avatar
Janka
Posts: 3585
Joined: 11. Feb 2006 19:10

#2 Post by Janka »

MS-Windows98 benutzt nicht die Codepages iso8859-..., sondern die "alten" PC-Codepages cp437, cp850 und folgende.
Wenn du den Native Language Support für diese Codepages im Kernel drin hast, werden die Datei*namen* beim mounten automatisch konvertiert. Die Dateiinhalte werden nicht angefasst.

Janka
Ich vertonne Spam immer in /dev/dsp statt /dev/null.
Ich mag die Schreie.

Post Reply