Login
Newsletter
Werbung

Thema: Hello World!? Sprachsynthese und Spracherkennung mit freier Software

5 Kommentar(e) || Alle anzeigen ||  RSS || Kommentieren
Kommentare von Lesern spiegeln nicht unbedingt die Meinung der Redaktion wider.
0
Von marvin42 am Do, 18. Oktober 2018 um 19:10 #

Vielleicht geht es ja nur mir so, aber was ich nicht verstehe: Wieso brauche ich für die Spracherkennung mit deepspeech das/ein Modell? Oder anders gefragt: Was macht deepspeech einerseits und die Modelle andererseits?

  • 0
    Von Anonymous am Do, 18. Oktober 2018 um 22:24 #

    Ich habe zwar keine Ahnung, aber ich verstehe das so, dass deepspeech der allgemeine Werkzeugkasten ist, der aber noch keine konkrete Sprache bzw. keinen konkreten Dialekt enthält; die müssen erst trainiert werden, und das Ergebnis des Trainings nennt man dann Modell.

    • 0
      Von jstaerk am Fr, 19. Oktober 2018 um 08:24 #

      Ja so habe ich es auch verstanden :-)
      Ich bin mir ziemlich sicher dass man deepspeech mit entsprechenden Trainingsdateien beispielsweise auch deutsch als Model beibringen kann. Da es dann aber in der Regel nicht nur darum geht einen einzelnen Sprecher anzulernen, was vielleicht in wenigen Stunden erledigt wäre stelle ich mir den Aufwand recht umfangreich vor, das war wohl auch der Anlass für das Common Voice Projekt auf https://voice.mozilla.org/

0
Von SarahJ am Di, 9. April 2019 um 21:22 #

Hallo zusammen,

hab mir heute deepspeech erfolgreich installiert und auch zwecks deutschsprachiger Transkriptionen das Archiv mit den deutschen Daten vom Mozilla Voice Projekt heruntergeladen (mittlerweile rund 4GB).
Allerdings weiß ich nun nicht, wie ich die genau dem deepspeech füttern muß, damit dieses nun auch deutsch verstehen lernt?
Kann mir da bitte jemand weiterhelfen?
Arbeite mit Debian 9 testing.

Liebsten Dank an alle im Voraus! Und ich finde es großartig, was Mozilla da wegweisendes auf die Beine gestellt hat!

Sarah

P.S.: Da ich geschäftliche, vertrauliche Diktate als Text brauche, aber als Startup kein Budget für einen VA oder ein Transkriptionsbüro habe, kommen Frontends für Google Translate, Deepl.com und Co. halt grundsätzlich gar nicht infrage... Umso dankbarer bin ich für diese hier im Artikel vorgestellte Offline-Lösung :)

  • 0
    Von Anleitung gefunden am Mo, 15. April 2019 um 12:10 #

    Hab hier eine Anleitung dafür gefunden,

    https://github.com/mozilla/DeepSpeech/#training-a-model

    allerdings komme ich da beim Schritt des Imports der Trainingsdaten vom Mozillaprojekt nicht weiter, da egal ob ich python nun mit oder ohne virtuelle umgebung installiere, nirgends auf meinem Rechner die in der anleitung erwähnten ordner bzw skripte zu finden sind... Was nun? Bin allerdings noch totaler Python-Newbie... Bin grad mit meinem Latein am Ende.

    Wer hat nen heißen Tip für mich?

    Allerliebsten Dank!

    Sarah

Pro-Linux
Pro-Linux @Facebook
Neue Nachrichten
Werbung