Login
Newsletter
Werbung

Di, 28. Januar 2014, 12:25

Software::Büro

LanguageTool spürt Textfehler in der Wikipedia auf

Ein Versuch mit LanguageTool ergab, dass das freie Werkzeug allein in der deutschsprachigen Wikipedia eine Million Tippfehler, Grammatikfehler und stilistische Zweifelsfälle finden könnte.

LanguageTool 1.8 im Einsatz unter LibreOffice 3.5

Markus Brenneis

LanguageTool 1.8 im Einsatz unter LibreOffice 3.5

Das Experiment bestand darin, mit der freien Stil- und Grammatik-Prüfsoftware LanguageTool eine Auswahl von rund 1000 Artikeln der deutschsprachigen Wikipedia zu prüfen. Eine vollständige Prüfung der Wikipedia-Inhalte wäre zu aufwendig gewesen. Von den gefundenen potenziellen Fehlern wurden 300 manuell von von dem erfahrenen Lektor Julian von Heyl (www.korrekturen.de) verifiziert. Hochgerechnet auf alle 1,6 Millionen Wikipedia-Artikel könnte LanguageTool eine Million Fehler automatisch finden.

Zu den typischen gefundenen Fehlern gehören unter anderem Probleme mit der Groß-/Kleinschreibung (»auf deutsch« statt »auf Deutsch«), englische Anführungszeichen in deutschem Text und Grammatikfehler (»den größten Wahlerfolge« statt »den größten Wahlerfolg«). LanguageTool konnte hierbei laut den Entwicklern auch Wikipedia-spezifische Probleme aufdecken: So sind Ausdrücke wie »seit kurzem« für eine Enzyklopädie zu unspezifisch und sollten durch eine genaue Zeitangabe ersetzt werden.

Der Versuch hat laut Julian von Heyl gezeigt, dass Korrektursoftware überall dort sinnvoll sein kann, wo regelmäßig große Mengen nutzergenerierter Inhalte anfallen. Um die Wikipedianer bei der Suche nach Textfehlern zu unterstützen, stellt das LanguageTool-Projekt viele gefundene Fehler auf seiner Website zur Verfügung und hat außerdem ein Werkzeug entwickelt, mit dem alle Neueinträge und Änderungen der Wikipedia automatisch überprüft werden können.

Die Wikipedia-Prüfung und die neuen Werkzeuge werden auch auf der diesjährigen FOSDEM-Konferenz vorgestellt, die am 1. und 2. Februar 2014 in Brüssel stattfindet. Der LanguageTool-Entwickler Daniel Naber hält dort die Eröffnungsrede.

LanguageTool wurde bereits in einer Artikelserie auf Pro-Linux.de und freiesMagazin vorgestellt. Das Programm findet Fehler, indem es den Text nach bestimmten Fehlermustern durchsucht. In deutschen Texten erkennt die Software nach Angaben der Entwickler mehr als 1700 Fehlermuster. Zusätzlich kann man selbst neue Muster definieren. LanguageTool wird von einem Team von zehn Freiwilligen weiterentwickelt und steht unter der LGPL.

Werbung
Kommentare (Insgesamt: 11 || Alle anzeigen )
Re: was man so alles überliest... (hjb, Mi, 29. Januar 2014)
dt. Sprachtools brauchen mehr Unterstützer (Aldii, Mi, 29. Januar 2014)
was man so alles überliest... (Berliner Optimist, Mi, 29. Januar 2014)
Re[3]: @Pro-Linux (HMEDW, Di, 28. Januar 2014)
Re: @Pro-Linux (Leisten, Di, 28. Januar 2014)
Pro-Linux
Pro-Linux @Facebook
Neue Nachrichten
Werbung