UTF-8 im Terminal
Posted: 03. Aug 2009 11:03
Hai!
Die UTF-8-Unterstützung in Linux ist inzwischen ja recht ausgereift. Andererseits stoße ich häufig auf Textdateien, die noch in ISO-8859-1(5) kodiert sind. Und wenn ich die auf dem Terminal ausgeben will (mit Tools wie "cat" oder "less"), gibt es ein Problem:
Ist mein "xterm" auf UTF-8 geschaltet, werden die Zeichen mit dem achten Bit als Kauderwelsch oder als "unmöglich" (leeres Kästchen) dargestellt.
Ist es auf 1-byte-Zeichen gestellt, so wird eine solche Textdatei natürlich richtig dargestellt, aber dafür die UTF-8-kodierten falsch. Zudem kann ich keine Nicht-ASCII-Zeichen mehr eingeben, weil die Tastatureingabe ja auch auf UTF-8 gemünzt ist.
Was tun?
Gibt es nicht eine Möglichkeit, daß ein Terminal jedes Byte, das es nicht als Teil einer UTF-8-Bytesequenz interpretieren kann, als ISO-8859-1 betrachtet und ausgibt? Also so eine Art Hybridmodus?
Programme wie "vi" scheinen es ja auch zu kapieren und stellen eine Datei fast unter allen Umständen richtig dar.
MfG
Tronar
Die UTF-8-Unterstützung in Linux ist inzwischen ja recht ausgereift. Andererseits stoße ich häufig auf Textdateien, die noch in ISO-8859-1(5) kodiert sind. Und wenn ich die auf dem Terminal ausgeben will (mit Tools wie "cat" oder "less"), gibt es ein Problem:
Ist mein "xterm" auf UTF-8 geschaltet, werden die Zeichen mit dem achten Bit als Kauderwelsch oder als "unmöglich" (leeres Kästchen) dargestellt.
Ist es auf 1-byte-Zeichen gestellt, so wird eine solche Textdatei natürlich richtig dargestellt, aber dafür die UTF-8-kodierten falsch. Zudem kann ich keine Nicht-ASCII-Zeichen mehr eingeben, weil die Tastatureingabe ja auch auf UTF-8 gemünzt ist.
Was tun?
Gibt es nicht eine Möglichkeit, daß ein Terminal jedes Byte, das es nicht als Teil einer UTF-8-Bytesequenz interpretieren kann, als ISO-8859-1 betrachtet und ausgibt? Also so eine Art Hybridmodus?
Programme wie "vi" scheinen es ja auch zu kapieren und stellen eine Datei fast unter allen Umständen richtig dar.
MfG
Tronar