Gemeinschaft::Organisationen
Common Voice wird mehrsprachig
Mozilla hat eine mehrsprachige Version von Common Voice gestartet. Neben Englisch können nun auch Stimmproben auf Deutsch, Französisch und Walisisch abgegeben werden.
Mozilla
Entstehungsprozess von der Common Voice-Datenbank
Common Voice ist ein Projekt, das von Mozilla vor einem halben Jahr bei der Freigabe der
Engine DeepSpeech und Daten für Spracherkennung begonnen wurde. Mit diesen sollten den den Markt dominierenden proprietären Spracherkennungssystemen freier Code und freie Daten entgegengesetzt werden. Denn Spracherkennung ist heutzutage alltäglich und wird in vielen Bereichen eingesetzt. Was Entwickler, Forscher und Startups derzeit davon abhält, tiefer in die Spracherkennung einzusteigen, ist laut Mozilla, dass nicht jeder Zugriff auf die notwendigen Daten und technologischen Hilfsmittel hat.
Aus diesem Grund setzt sich Mozilla seit Ende 2017 für eine Öffnung des vergleichsweise jungen Technologiesegments ein, so dass sich immer mehr Menschen beteiligen, ihre Innovationen einbringen und mit den großen Konzernen in Wettbewerb treten können.
Mozilla
Mozilla DeepSpeech und Common Voice
Das Projekt Common Voice, das schon vor der Freigabe von DeepSpeech gestartet wurde, ist eine öffentlich und frei zugängliche Sprachdatenbank, in der Mozilla über seine Webseite und die iOS-App Sprachaufnahmen von zenhtausenden unterschiedlichen Personen gesammelt hat. Bis jetzt waren alle Aufnahmen auf Englisch. Ziel des Projekts war es jedoch von Anfang an, möglichst viele Sprachen zu unterstützen, um Spracherkennungstechnologie offener, leichter zugänglich und insgesamt inklusiver zu gestalten.
Ab sofort können nun auch Stimmproben auf Deutsch, Französisch und Walisisch abgegeben werden, wie Mozilla jetzt angekündigt hat. Darüber hinaus arbeitet das Team laut Mozilla bereits an 40 weiteren Sprachversionen, nicht nur den großen, naheliegenden wie Spanisch, Chinesisch oder Russisch, sondern auch an kleineren, wie etwa Friesisch, Norwegisch oder Tschuwaschisch. Für Mozilla sind diese Sprachen mit vergleichsweise kleinem Verbreitungsgebiet wichtig, weil sie von etablierten kommerziellen Digital- und Spracherkennungsdiensten häufig vernachlässigt werden. Stehen diese Daten jedoch erst einmal zur Verfügung, können Unternehmer und Gemeinschaften die bestehende Lücke selbst schließen. Jeder ist eingeladen, an Common Voice mitzuwirken und Sprachproben einzusprechen.