Login
Newsletter
Werbung

Fr, 7. November 2014, 11:59

Software::Desktop

Pocketvox steuert Desktop per Sprache

Der in seiner Sehtauglichkeit eingeschränkte Franzose Benoit Franquet hat mit Pocketvox eine Anwendung und Entwicklerbibliothek erstellt, mit deren Hilfe die Barrierefreiheit des Desktops erhöht werden soll. Mit Pocketvox erhalten Anwender eine Sprachsteuerung für ihren Desktop.

Pocketvox basiert auf verschiedenen Open-Source-Bibliotheken. Unter anderem verwendet die Software Sphinxbase, Pocketsphinx, Gstreamer, GLib-2.0, GObject-2.0 und Gtk+. Um Nutzern Rückmeldungen über einen Audiokanal geben zu können, greift die Anwendung auf Espeak zurück. Pocketvox wird mit mehreren Werkzeugen ausgeliefert, mit denen Entwickler eigene sprachgesteuerte Anwendungen umsetzen bzw. Endbenutzer ihren Desktop steuern können.

Für Desktopanwender beinhaltet Pocketvox einen Eintrag ins Startmenü, ein Panel-Applet um die Anwendung zu verwalten und eine Konfigurationsoberfläche. Es ist möglich, Sprach-Kommandos via TCP zu empfangen. Anwender können neue Befehle zur Desktopsteuerung in einer Textdatei eintragen, bzw. entsprechende Textdateien für verschiedene Anwendungen anlegen. Die Anwendung erkennt, welches Fenster sich im Vordergrund befindet. So ist es möglich, anwendungsspezifische Kommandos abzusetzen. Um ein Fehlverhalten möglichst zu vermeiden, können Anwender ein Triggerwort angeben. Erst wenn der Trigger erkannt wurde, versucht Pocketvox die nachfolgenden Worte als Kommando zu interpretieren.

Pocketvox bringt mehrere Hilfsskripte mit, etwa um Sprachmodelle zu erstellen. Von Haus aus funktioniert die Sprachsteuerung mit sämtlichen Sprachmodellen, Akustikmodellen und Wörterbüchern, die im Github-Repositorium der Spracherkennung CMU Sphinx erhältlich sind. Pocketvox gibt es momentan in englischer und französischer Lokalisierung. Für Entwickler hat Franquet eine Bibliothek erstellt, mit der Pocketvox für eigene Anwendungen und Python-Module genutzt werden kann.

Für Linux gibt es mehrere Spracherkennungssysteme wie CMU Sphinx, Julius oder Kaldi. Anwendungen, die genutzt werden können um den Rechner via Sprache zu bedienen oder gar Briefe und Emails zu diktieren, sind noch recht rar. Seit einigen Jahren gibt es das Projekt Simon, dass wie Pocketvox behinderte Nutzer bei der Desktopbedienung unterstützen möchte.

Pocketvox ist in C implementiert. Bei der Lizenz entschied sich Franquet für die GPLv3. Pocketvox kann via Github heruntergeladen werden.

Werbung
Pro-Linux
Pro-Linux @Facebook
Neue Nachrichten
Werbung