Login
Newsletter
Werbung

Do, 13. Dezember 2012, 15:00

LanguageTool-Tutorial Teil III: Java-Regeln und falsche Freunde

Von gulp21

Nachdem sich Teil I und Teil II dieser Tutorial-Reihe mit XML-Regeln beschäftigt haben, geht es in diesem Teil um in Java geschriebene Regeln. Grundlegende Programmierkenntnisse sind dabei hilfreich. Außerdem wird ein Blick auf die Regeldatei für die Warnung vor falschen Freunden geworfen.

Vorarbeiten

Wenn man eine Java-Regel erstellen möchte, muss als Erstes der Quellcode von LanguageTool heruntergeladen werden. Dies geschieht mit dem Befehl

$ svn co https://languagetool.svn.sourceforge.net/svnroot/languagetool/trunk/JLanguageTool languagetool

Sollte Subversion (SVN ) nicht installiert sein, kann es mit Hilfe der Paketverwaltung nachinstalliert werden. Außerdem muss zum Kompilieren von LanguageTool ant installiert werden.

Die »spiegelt ... wieder«-Regel

Es lässt sich zwar fast immer eine Möglichkeit finden, eine Regel in XML umzusetzen, aber manchmal reichen die zur Verfügung stehenden XML-Elemente nicht aus. Deshalb ist es auch möglich, Regeln direkt in Java zu schreiben, was dann jedoch Programmierkenntnisse voraussetzt. Ferner bieten Java-Regeln z.B. die Möglichkeit, mit Wortlisten zu arbeiten, wie es beispielsweise die Kompositum-Regel tut, die anhand der in compounds.txt hinterlegten Liste prüft, ob ein Wort fälschlicherweise getrennt geschrieben wurde. Eine Umsetzung in XML würde viel zu viel ähnlichen, sich wiederholenden Code zur Folge haben. Des Weiteren können Java-Regeln auch sprachübergreifend genutzt werden, wie z.B. die Regel, die prüft, ob ein Wort wiederholt wird. Zu guter Letzt mag es für einen Programmierer einfacher sein, eine Regel in Java umzusetzen, als sich zuerst mit der XML-Syntax auseinanderzusetzen.

Da die meisten Java-Regeln zu komplex sind, um sie in diesem Artikel Schritt für Schritt zu erstellen oder zu erläutern, wird nun anhand der einfachen »Möglicher Tippfehler 'spiegeln ... wieder (wider)'«-Regel erklärt, wie eine Java-Regel grundsätzlich aussieht. Sie erkennt z.B. den Fehler in dem Satz »Der Antrag spiegelt dies wieder«, in dem »wider« statt »wieder« verwendet werden muss, da die Grundform » widerspiegeln« lautet. (Diese Regel könnte übrigens auch relativ einfach in XML umgesetzt werden, sie ist aber zu Demonstrationszwecken gut geeignet.) Der Code der Regel befindet sich in der Datei WiederVsWiderRule.java, welche im Verzeichnis src/main/java/org/languagetool/rules/de/ zu finden ist. Alle deutschen Java-Regeln befinden sich in diesem Verzeichnis und sind nach dem Muster Rule.java benannt.

Kommentare (Insgesamt: 0 )
Pro-Linux
Pro-Linux @Facebook
Neue Nachrichten
Werbung