Login
Newsletter
Werbung

So, 30. November 2003, 22:11

Bessere Rechtschreibprüfung für Linux gesucht

Der Autor der deutschen Wörterbücher für neue Rechtschreibung, Björn Jacke, hat eine Seite ins Netz gestellt, die erklärt, warum die Rechtschreibprüfung in deutscher Sprache derzeit so unbefriedigend ist.

Vor allem zusammengesetzte Wörter (Komposita) wie »Rechtschreib-prüfung« werden fast nie richtig erkannt. Dies liegt daran, daß das erste Teilwort in vielen Fällen modifiziert wird, hier zum Beispiel wird eine Endung weggelassen.

Es gibt drei freie Rechtschreibprüfungen für Linux:

  • ispell, das in C geschriebene Original. Es besitzt eine Affix-Kompression, was bedeutet, daß häufig verwendete Beugungsformen von Wörtern automatisch bekannt sind, wenn das Wörterbuch einen entsprechenden Code enthält.
  • aspell, eine neuere Rechtschreibprüfung in C++. Leider besitzt sie keine Affix-Kompression, dafür aber die Fähigkeit, phonetisch ähnliche Wörter vorzuschlagen. Sie kann also auch dann noch sinnvolle Korrekturvorschläge machen, wenn ein Wort phonetisch ähnlich geschrieben ist wie das korrekte Wort.
  • myspell ist nur eine Bibliothek, die eine Affix-Kompression besitzt, aber nur rudimentäre phonetische Ähnlichkeitserkennung.

Alternativen zu den freien Programmen für Linux gibt es bislang wenige:

  • Die Duden-Linguistic-Engine steht zwar auch für Linux zur Verfügung, aber eine Anpassung an OpenOffice fehlt bislang.
  • Mit Staroffice verliert man teilweise die Vorteile von Open Source.

Björn Jacke schlägt daher vor, die Programme und Wörterbücher um ein weiteres Attribut zu erweitern, das anzeigt, ob ein Kompositum möglich ist. Das soll ähnlich wie die bislang vorhandene "Affix compression" funktionieren. Es müßten sich nur Leute finden, die dieses Projekt in Angriff nehmen. Das OpenThesaurus-Projekt zeigt, dass eine Gemeinschaft auch linguistische Komponenten für den Linux Desktop erstellen kann. (Dank an Moritz Moeller-Herrmann.)

Werbung
Pro-Linux
Pro-Linux @Facebook
Neue Nachrichten
Werbung