Login
Newsletter
Werbung

Mi, 21. Oktober 2015, 14:39

Software::Wissenschaft

Sprachsyntheseprojekt Gnuspeech 0.9 freigegeben

Nach über 12 Jahren Entwicklung hat das Sprachsyntheseprojekt Gnuspeech seine erste offizielle Veröffentlichung herausgegeben. Gnuspeech erzeugt englische Sprachausgaben mit hoher Genauigkeit aufgrund eines Modells der menschlichen Spracherzeugung.

Mirko Lindner

Gnuspeech besteht aus zahlreichen Komponenten, deren Ursprünge zum Teil in die Zeit der NeXT-Workstations zurückreichen. Diese Workstations zeichneten sich vor rund 20 Jahren unter anderem dadurch aus, dass sie einen digitalen Signalprozessor an Bord hatten, der bestimmte Operationen auf ähnliche Weise beschleunigen konnte wie später die MMX-Instruktionen oder Shader in aktuellen Grafikprozessoren.

Im Gegensatz zu anderen Sprachsyntheseprojekten, die inzwischen bereits verschiedene Stimmen in verschiedenen Sprachen erzeugen können, mutet Gnuspeech immer noch ziemlich akademisch und wenig auf die praktische Einsetzbarkeit ausgerichtet an. So legt das Projekt besonderen Wert auf ein genaues Modell der menschlichen Spracherzeugung. Seine zugehörigen Datenbanken beschreiben alle Laute und deren Kombinationsmöglichkeiten. Mehr als 70.000 Wörter sind mitsamt ihrer Ausspracheregeln gespeichert. Das Projekt beschränkt sich bisher ausschließlich auf Englisch, dafür stehen für diese Sprache Modelle des Sprachrhythmus und der Intonation bereit, die auf den Ergebnissen ausgiebiger Forschung beruhen. Nach Ansicht der Entwickler setzt Gnuspeech damit einen neuen Standard für synthetische Sprache und die Computer-basierte Sprachforschung.

Die Veröffentlichung besteht aus zwei verschiedenen Systemen. gnuspeechsa ist eine portable, plattformübergreifende und leicht zu compilierende Sprachsynthese für alle, die einfach nur die Spracherzeugung nutzen wollen, und liegt in Version 0.1.5 vor. Deutlich umfangreicher ist gnuspeech, das in Version 0.9 bereitgestellt wird. Es bietet Möglichkeiten zum Zugriff auf die zugrundeliegenden Datenbanken und Algorithmen, was für eigene Experimente und Arbeiten genutzt werden kann. Zu den mitgelieferten Programmen zählen das interaktive Datenbankbearbeitungswerkzeug Monet und die grafische Oberfläche TRAcT für das Resonanzmodell. Das unter der GPLv3 stehende Projekt besitzt eine Entwicklerseite auf savannah.gnu.org. Die Tar-Archive können vom FTP-Server von GNU heruntergeladen werden.

Werbung
Kommentare (Insgesamt: 5 || Alle anzeigen )
Pro-Linux
Pro-Linux @Facebook
Neue Nachrichten
Werbung