Common Voice veröffentlicht umfangreiche Sprachdaten

Funktion steht nur registrierten Nutzern zur Verfügung!

Newsletter

Funktion steht nur registrierten Nutzern zur Verfügung!

Lesezeichen hinzufügen

Do, 28. Februar 2019, 16:24

Software::Entwicklung

Common Voice veröffentlicht umfangreiche Sprachdaten

Das von Mozilla betriebene Common Voice-Projekt hat die bisher aufgenommenen Sprachdaten veröffentlicht. Es handelt sich um die größte je veröffentlichte Sammlung von freien Sprachdaten.

Von Hans-Joachim Baader

Mozilla

Mozilla DeepSpeech und Common Voice

Common Voice ist ein Projekt, das von Mozilla im Herbst 2017 bei der Freigabe der Engine DeepSpeech und Daten für Spracherkennung begonnen wurde. Mit diesen sollten den den Markt dominierenden proprietären Spracherkennungssystemen freier Code und freie Daten entgegengesetzt werden. Denn Spracherkennung ist heutzutage alltäglich und wird in vielen Bereichen eingesetzt. Was Entwickler, Forscher und Startups derzeit davon abhält, tiefer in die Spracherkennung einzusteigen, ist laut Mozilla, dass nicht jeder Zugriff auf die notwendigen Daten und technologischen Hilfsmittel hat. Aus diesem Grund setzt sich Mozilla seither für eine Öffnung des vergleichsweise jungen Technologiesegments ein, so dass sich immer mehr Menschen beteiligen, ihre Innovationen einbringen und mit den großen Konzernen in Wettbewerb treten können.

Das Projekt Common Voice, das schon vor der Freigabe von DeepSpeech gestartet wurde, ist eine öffentlich und frei zugängliche Sprachdatenbank, in der Mozilla über seine Webseite und die iOS-App Sprachaufnahmen von zenhtausenden unterschiedlichen Personen gesammelt hat. Anfangs waren alle Aufnahmen auf Englisch, inzwischen sind weitere Sprachen hinzugekommen.

Jetzt hat Mozilla die erste mehrsprachige Sammlung von Sprachdaten veröffentlicht. Daten stehen jetzt in 18 Sprachen, eingesprochen von über 42.000 Personen, zur Verfügung. Gegenüber der ursprünglichen, rein englischen Sammlung ist der Datenumfang von 500 auf 1400 Stunden angewachsen. Die Lizenz dieser Daten ist die Creative Commons CC0, anderes gesagt sind sie gemeinfrei. Alle Daten stehen zum freien Download auf der Common Voice-Seite bereit. Zu den Daten gibt es Metadaten, die Auskunft über Alter, Geschlecht und Akzent des Beitragenden geben. Man sollte hier aber keine Vollständigkeit erwarten, da die Angabe dieser Daten optional ist.

Die Beteiligung an Common Voice hat die Erwartungen von Mozilla übertroffen. Das Projekt läuft weiter und wird auf weitere Sprachen ausgeweitet mit dem Ziel, möglichst vollständige Daten zu erhalten. Genutzt werden die Daten bereits in Projekten wie dem freien Sprachassistenten Mycroft, dem freien persönlichen Assistenten Leon und anderen. Mozilla selbst will in Zukunft ebenfalls sprachfähige Produkte entwickeln oder die Fähigkeit in bestehende Produkte einbauen. Zur eigenen Nutzung der Daten kann unser Artikel vom letzten Oktober als Ausgangspunkt herangezogen werden.