Login
Newsletter
Werbung

Fr, 24. Oktober 2003, 07:43

LingPipe wird Open Source

Die Firma Alias-i Inc stellt ihr Sprachverarbeitungs-Produkt LingPipe unter eine Open-Source-Lizenz.

LingPipe, jetzt in Version 1.0 veröffentlicht, ist eine Sammlung von Java-Tools zur sprachlichen Analyse von Text. Es ist robust genug für den kommerziellen Einsatz und wird bereits von der US-Verwaltung eingesetzt. Es ist aber auch flexibel genug, um für Forscher interessant zu sein. Die Sammlung enthält Kommandozeilen-Tools zum statistischen Erkennen von Bezeichnungen, die sich auf dasselbe Objekt beziehen, eine heuristische Erkennung der Satzgrenzen und Begriffe innerhalb eines Dokumentes heuristisch miteinander in Beziehung setzen.

Die Tools sind mit englischen Daten versehen, können jedoch auch für andere Sprachen trainiert werden. Tools zum Trainieren und Evaluieren sind ebenfalls in dem Paket mit dabei. Ein- und Ausgabe erfolgt im HTML- oder XML-Format. Bei der Verarbeitung kommen XML-Technologien zum Einsatz.

Java ist heutzutage in der Performance nicht mehr unbedingt schlechter als C oder C++. Bei bestimmten Aufgaben kann es sogar schneller sein. Alias-i gibt an, daß die Geschwindigkeit von LingPipe auf normalen PCs ausreichend ist für eine Analyse in Echtzeit. Bis zu 100.000 Wörter pro Sekunde sollen bei Verwendung von Sun Java 1.4.2 verarbeitet werden.

LingPipe ist unter einer freien Lizenz. verfügbar. Es kann von der Download-Seite heruntergeladen werden. Wer das Tool in einem kommerziellen Produkt einsetzen will, kann von Alias-i eine kostenpflichtige kommerzielle Lizenz erhalten. Dies ist eine Vorgehensweise, die von vielen anderen Firmen bereits bekannt ist, beispielsweise von Trolltech mit der Qt-Bibliothek.

Werbung
Pro-Linux
Pro-Linux @Facebook
Neue Nachrichten
Werbung