1 Zuletzt bearbeitet von Marius Raabe (13.05.2011 13:21:10)

Thema: 4. Schritt: Text oder Befehl? - Alles eine Frage des Rhythmus!

4. Schritt: Text oder Befehl? - Alles eine Frage des Rhythmus!


In diesem Abschnitt soll es darum gehen, die Bedeutung des Diktierstils unter rhythmischem Aspekt für die effiziente Verwendung des Spracherkennungsprogramms grundlegend zu erklären. In den vorhergehenden Abschnitten wurde bereits erläutert, dass ein möglichst stets zusammenhängendes Diktat für die Erkennungsleistung von entscheidender Bedeutung ist. Dies gilt immer und uneingeschränkt, allerdings ist noch ein weiterer Aspekt in diesem Zusammenhang ebenso wichtig.

Die Spracherkennungssoftware ist einerseits für die Erstellung von Texten konzipiert, andererseits aber dient sie zugleich der Steuerung des Computers mittels Sprachbefehlen. Programmtechnisch wird dies dadurch realisiert, dass verschiedene Modi miteinander kombiniert werden. Unter dem Menüpunkt "Wörter" auf der Dragon-Leiste sind die verschiedenen Modi aufgelistet, in der Voreinstellung ist der so genannte "Standardmodus" aktiv, der die beiden Untergruppen "Diktiermodus" und "Befehlsmodus" miteinander verbindet. In diesem Menü können die jeweiligen Modi gewählt werden.

Wenn beispielsweise lediglich der "Diktiermodus" eingestellt ist, sind alle Sprachbefehle deaktiviert, jede Eingabe wird als Text interpretiert, zur Verfügung stehen nur noch Befehle wie "Neue Zeile" oder "Neuer Absatz", bei denen es sich im strengen Sinne auch eigentlich nicht um Befehle handelt.

Sobald aber der Befehlsmodus, etwa über den Standardmodus, aktiv ist, werden Befehle erkannt und umgesetzt. Voraussetzung dafür aber ist, dass vor und nach dem Befehl eine Pause gesprochen wird, wodurch sich der Befehlsnamen vom umgebenden Text absetzt. Wenn eine Äußerung als Befehl erkannt wird, wird das kleine Erkennungsfenster zusätzlich blau umrandet.

Dieser Umstand hat aber grundlegende Bedeutung für den Diktierrhythmus im Allgemeinen. Positiv betrachtet, kann durch Pausen an den richtigen Stellen die Texteingabe unterbrochen und die Ausführung eines Befehls ausgelöst werden. Negativ betrachtet, kann es vorkommen, dass durch eine Pause an der falschen Stelle der Texteingabe als Befehl erkannt wird, oder im Umkehrschluss wird ein Befehl vielleicht deshalb nicht erkannt, weil davor keine oder keine hinreichende Pause diktiert worden ist. Hierzu einige Beispiele:

  • Das Wort "zurück" dient zugleich als Befehlsnamen und bewirkte (bis Version 10), dass der Cursor dorthin verschoben wird, wo er letztmalig manuell oder mittels Sprachbefehlen gesetzt wurde. Dies kann fatale Auswirkungen haben, wenn beispielsweise ein Satz wie "ich rufe ihn heute noch zurück" mit umfassendem Rhythmus (zu lange Pausen zwischen den Wörtern) diktiert wird, wie man sich leicht denken kann. In Version 11 wurde die Syntax zu "zurück gehen" geändert, den Befehl "zurück" gibt es - je nach Zielanwendung, in die diktiert wird - aber weiterhin.

  • In ähnlicher Weise wirkt etwa der Befehl "rückgängig" - als Kurzform von "mach das rückgängig" -, die zuletzt vorgenommene Aktion wird dadurch widerrufen. Diktieren Sie doch einmal: "Ich mache die Änderung [Pause] rückgängig".

  • Gemäß den Voreinstellungen können Menüs und Schaltflächen im jeweils aktiven Fenster mittels Diktat direkt angesprochen werden. In fast allen Texteingabefenstern befindet sich ein Menü namens "Bearbeiten". Was aber geschieht, wenn man beispielsweise den Satz "ich werde den Vorgang heute noch bearbeiten" ungeschickt diktiert?

  • Noch ein Beispiel. In Microsoft Outlook bewirkt der Befehl "Senden", dass eine E-Mail sofort abgeschickt wird. Stellen Sie sich vor, Sie diktieren einen Satz wie "können Sie mir die Fotos senden", und kommen dabei aus dem Rhythmus?

Im Umkehrschluss, wenn ein Befehl deshalb nicht erkannt wird, weil die Pause davor zu kurz ist, ist das Resultat zwar ärgerlich, die Auswirkungen sind demgegenüber jedoch vergleichsweise leicht zu verkraften, dann wird er eben als Text, nicht selten auch nur in ähnlicher Weise, in das Dokument geschrieben. Zu beheben ist das dann mit dem Befehl "streich das", aber bitte mit einer Pause davor!

Fazit: Ein gut entwickelter Diktierrhythmus berücksichtig sowohl das flüssige Textdiktat, als auch die Pausen an der richtigen Stelle für eine einwandfreie Befehlserkennung.

DPI 15 (15.00.000.076) auf Windows 8.1 (64-bit)
SpeechMike Premium (LFH3500) mit Philips Device Control Center (3.0)
Intel i7 2600 QuadCore - 3.4 GHz - 8 MB L3-Cache - 6 GB RAM