Da ich hier drei verschiedene kabelgebundene Headsets liegen habe, bin ich zwei Fragestellungen nachgegangen: (1) Unterscheiden sich die Headsets in ihrer Verwendbarkeit für Dragon NaturallySpeaking? (2) Hat die Positionierung des Mikrofons Auswirkungen auf die Erkennungsqualität oder Performance?
Testaufbau:
Hard- und Softwareausstattung Gigabyte GA-Z68X-UD3H-B3, Intel Core i7-2600K (4x3,40Ghz, 8 MB Cache), 16 GB RAM Windows 7 Professional (64-bit) DNS 11.5 Premium Alle Tests wurden in einer fast lautlosen Umgebung durchgeführt. Rechner stehen bei mir nicht im Arbeitszimmer. Alle Headsets wurden nacheinander an einem aktiven USB Hub (Exsys EX-1177) angeschlossen. Für jedes Headset wurde ein neues Profil erstellt. Während der Tests wurden keine Änderungen im Profil gespeichert. Zum Test habe ich das Tool "Testing DNS Performance" verwendet (http://dragon-spracherkennung.forumprofi...nce-in-dns.html). Headset Andrea NC-181VM USB mit Andrea USB-Soundkarte im USB Stecker Das Headset wird von Nuance besonders empfohlen (sechs Drachen) und kostet in Deutschland ca. 55 €. (http://www.mikrofone24.de). Der Mikrofonarm ist sehr flexibel, so dass das Mikrofon auf drei verschiedene Arten positioniert werden kann: (1) Mikrofon so positioniert, dass es nah und mittig an der Wange etwas oberhalb des Mundes sitzt. Ein quer in den Mund genommener Bleistift passt problemlos vor das Mikrofon. Der Mikrofonarm wird dazu wie ein "n" gebogen; ansonsten ist er viel zu lang. Er kann mit einem Stück Klettband fixiert werden, so dass seine einmal eingestellte Länge nicht mehr ändert. (2) Mikrofon so positioniert, dass es unter dem Kinn sitzt. Ein senkrecht vor den Mund gehaltener Bleistift passt genau vor das Mikrofon. (3) Mikrofon so positioniert, dass es einen Fingerbreit neben dem Mundwinkel sitzt. Das ist die übliche Einstellung wie sie für Headsetmikrofone empfohlen wird. Den Andrea Treiber habe ich mit folgenden Einstellungen installiert: Einstellungen des Kopfhörers: Sound >Wiedergabe >Eigenschaften des Kopfhörers >Pegel >Mikrofon >0 und ausgeschaltet. Einstellungen des Mikrofons: Sound >Aufnahme >Eigenschaften von Mikrofon >Mikrofon Erweiterungen >Geräuschunterdrückung an; Mikrofon Verstärker 0 dB. Alle anderen Einstellungen sind unverändert.
Headset Jabra GN2100 Flexboom STD (2126-82-04) mit USB-Soundkarte GN 8110 USB Das Headset kostet ca. 125 €; die USB-Soundkarte GN 8110 USB ist nicht mehr lieferbar. Das Nachfolgemodell der USB-Soundkarte kostet ca. 50 €. Der Mikrofonarm ist fast starr, so dass das Mikrofon nur neben dem Mundwinkel positioniert werden kann. Alle Einstellungen aus der Installation der USB-Soundkarte habe ich unverändert übernommen.
Headset Sennheiser PC 26 USB angeschlossen am mitgelieferten USB Adapter Das Headset ist in Deutschland überall erhältlich und kostet ca. 45 €. Der Mikrofonarm ist fast starr, so dass das Mikrofon nur neben dem Mundwinkel positioniert werden kann. Alle Einstellungen aus der Installation der USB-Soundkarte habe ich unverändert übernommen.
Ansagetext für die Tests Den Text für alle Tests habe ich von Herrn Wilke übernommen (http://dragon-spracherkennung.forumprofi...2017.html#p2017). Er lautet "Der Angeklagte wird, was eine falsche Interpretation des geltenden Rechts ist, zu lebenslanger Freiheitsstrafe verurteilt." Diesen Text habe ich mit dem Windows-Audiorecorder für alle Mikrofone und Mikrofonpositionen als wma-Datei aufgenommen. Dies ist eine methodische Schwachstelle des Tests, denn für jede wma-Datei wurde der Text neu in den Audiorecorder gesprochen. Andererseits hat sich bei anderen Tests gezeigt, dass eine, mit Mikrofon A aufgenommene wma-Datei in einem, mit Mikrofon B erzeugten Sprachprofil mehr Zeit benötigt, um erkannt zu werden. Den Text habe ich sehr exakt und ohne Pausen gesprochen, so dass er bei allen Tests immer fehlerfrei erkannt wurde.
Testablauf:
Die fünf wma-Dateien wurden bei ausgeschaltetem Mikrofon mit drei unterschiedlichen Einstellungen für den Genauigkeitsregler ("Speed vs. Accuracy") im Testing DNS Performance Tool mehrfach abgespielt. Die folgende Tabelle zeigt den Performancefaktor als Verhältnis zwischen der Spracherkennungsverarbeitungsdauer und der Dauer für die Ansage des Textes. Die Bedeutung dieses Wertes ist im dritten Beitrag von http://dragon-spracherkennung.forumprofi...llbeispiel.html beschrieben.
1 2 3 4 5 6
Genauigkeitsregler 0 % 50 % 100 % GN 2100 Mikrofon im Mundwinkel 0.18 0.21 0.30 PC 26 USB Mikrofon im Mundwinkel 0.20 0.23 0.30 NC-181VM Mikrofon an der Wange 0.20 0.23 0.31 NC-181VM Mikrofon unter dem Kinn 0.21 0.24 0.32 NC-181VM Mikrofon im Mundwinkel 0.22 0.25 0.33
Die Ergebnisse innerhalb der Testreihe liegen so nah beieinander, dass man sie nicht für Differenzierungen einsetzen kann.
Wie sieht es aus, wenn ich den Text nicht als wma-Datei abspiele, sondern immer wieder in das Mikrofon spreche und im Testing DNS Performance Tool auswerte:
1 2 3 4 5 6
Genauigkeitsregler 0 % 50 % 100 % GN 2100 Mikrofon im Mundwinkel 0.96 0.97 1.00 PC 26 USB Mikrofon im Mundwinkel 0.97 0.98 0.98 NC-181VM Mikrofon an der Wange 0.96 0.97 0.98 NC-181VM Mikrofon unter dem Kinn NC-181VM Mikrofon im Mundwinkel 0.96 0.97 0.99
Die Ergebnisse zeigen, dass Dragon NaturallySpeaking bei der von mir eingesetzten Hardware etwas schneller arbeitet, wie ich spreche.
Hier liegen die Ergebnisse noch näher beieinander als in der vorherigen Testreihe, so dass man annehmen könnte, dass das Headset und die Position des Mikrofons nur eine untergeordnete Rolle spielt. Das ist bei mir aber nicht der Fall.
Wenn ich die drei Mikrofone neben dem Mundwinkel positioniere, atme ich beim Schweigen durch die Nase in das Mikrofon und es gibt meine Atemgeräusche wieder. In den Testergebnissen wird das nicht richtig sichtbar, denn ich habe die Tests ohne überflüssiges Ein - und Ausatmen durchgeführt. In der Praxis hat das jedoch gravierende negative Auswirkungen. Die Spracherkennung ist bei vielen Atemzügen damit beschäftigt, festzustellen, dass es sich nicht um Sprache handelt. So wird der Erkennungsprozess drastisch verlangsamt. Das kann man mit dem Testing DNS Performance Tool sehr schön nachvollziehen, indem man das Protokoll einschaltet (Button Show/Hide Log) und prüft, ob das Atmen oder andere Geräusche die Spracherkennung aktivieren und dadurch Protokolleinträge erzeugen. Sie sehen, was der Drache von ihrem Radau hält: "No text detected. Perhaps a command?". Klatschen Sie doch einmal in die Hände, tippen Sie auf der Tastatur oder klicken Sie mit der Maus. Reagiert Ihr Mikrofon auf die Gespräche anderer Personen? Es ist der gleiche Effekt, den der Sprachkenner mit "Bitte sagen Sie das noch einmal" visualisiert. Unterschiedlich ist nur, dass das Tool nur diktierten Text, Dragon NaturallySpeaking sowohl Text als auch Befehle erkennt.
Ein Hinweis zum Arbeiten mit dem Testing DNS Performance Tool: Es reagiert äußerst sensibel auf eine Übersteuerung des Mikrofoneingangs. Wenn Sie am Mikrofon herumspielen, um es anders zu positionieren, schalten Sie es zuvor unbedingt ab. Ansonsten kann es passieren, dass das Tool und Dragon ewig lange brauchen, bis sie wieder reagieren.
Ergebnisse: Welche Schlüsse ziehe ich daraus? (1) Alle drei Headsets sind – leistungsfähige Hardware vorausgesetzt – für Dragon NaturallySpeaking verwendbar. Ob der Einsatz von leistungsschwächerer Hardware zu anderen Ergebnissen führt, kann ich nicht beurteilen. (2) Die Positionierung des Mikrofons neben dem Mundwinkel ist für mich ungeeignet, wenn ich keine Möglichkeit finde, Atemgeräusche schon vom Mikrofonsystem herausfiltern zu lassen. Die Positionierung des Mikrofons an der Wange hat außerdem den Vorteil, dass der Mund frei bleibt. Ich kann wieder problemlos bei der Arbeit Kaffeetrinken.
Die intensive Beschäftigung mit dem Thema hat ein viel entscheidenderes Ergebnis zu Tage gefördert: Wenn ich nicht so exakt spreche wie in diesem Test, dann sinkt die Gesamtperformance der Spracherkennung schon allein deshalb, weil ich immer wieder damit beschäftigt bin, falsch erkannte Worte zu korrigieren. Daran zu arbeiten, hat einen höheren Nutzen, als immer wieder neue Mikrophone auszuprobieren – macht aber nicht so viel Spaß.
DNS 12.5 Premium; Windows 7 Professional (64-bit) Andrea NC-181VM USB Headset Intel Core i7-2600K 4x3,40Ghz - 16 GB RAM
Dateianlage:
Aufgrund eingeschränkter Benutzerrechte werden nur die Namen der Dateianhänge angezeigt Jetzt anmelden!
f11t883p6292n140.zip
Wahnsinn!!! - So liebe ich es ..., man kann es kaum besser machen, wenn überhaupt.
ZitatDie intensive Beschäftigung mit dem Thema hat ein viel entscheidenderes Ergebnis zu Tage gefördert: Wenn ich nicht so exakt spreche wie in diesem Test, dann sinkt die Gesamtperformance der Spracherkennung schon allein deshalb, weil ich immer wieder damit beschäftigt bin, falsch erkannte Worte zu korrigieren. Daran zu arbeiten, hat einen höheren Nutzen, als immer wieder neue Mikrophone auszuprobieren – macht aber nicht so viel Spaß.
So schlüssig wie der Testaufbau, so qualitativ ebenbürtig diese sehr zutreffende Zusammenfassung.
Vielen Dank!
Gruß, Rüdiger Wilke
_______________________________________
Dragon Professional 16 auf Windows 10 Pro und Windows 11 SpeechMike Premium (LFH3500); Office 2019 Pro + Office 365 (monatliches Abo) HP ZBook Fury 17 G8 - i7-11800H - 24 MB SmartCache - 32 GB RAM - 1 TB SSD
Ich habe mich früher bei der Arbeit immer sehr geärgert, als ich das von Dragon mitgelieferte Headset benutzt habe. Es war zu schwer. Der Bügel rutschte mir von meinem Kopf bzw. vor mein Gesicht, wenn ich aufstand (man soll beim Diktieren ja nicht immer sitzen). Es gab viele Atemgeräusche (die bei mir immer den schönen Ort "Minden" in das Diktat schmuggelten) und etwas trinken konnte ich auch nur, wenn ich das Diktat beendete. Dann wurde das Headset abgenommen oder aber das Mikrofon weggebogen.
Nun habe ich seit geraumer Zeit ein eigentlich für die Internettelephonie o.ä. gedachtes Headset von Sennheiser in Gebrauch, das mich sehr zufrieden stellt und bei dem die Erkennungsgenauigkeit in keiner Weise gelitten hat.
Es handelt sich dabei um das Sennheiser PC2 mit folgenden Vorteilen: – hohe Erkennungsgenauigkeit, – hoher Tragekomfort (sehr leicht, sitzt sehr gut), – Mikrofon soweit links an der Wange, das Atemgeräusche praktisch keine Rolle mehr spielen, – der Preis liegt bei ca. 17 € brutto.
Was vielleicht einige als Nachteil empfinden mögen, ich aber als Vorteil, ist die Tatsache, dass das Mikrofon nur der Höhe nach verstellbar ist, man also nicht den direkten Abstand zwischen dem Mund und dem Mikrofon ändern kann.
Ich empfinde dies als Vorteil, weil der direkte Abstand immer konstant bleibt und man lediglich der Höhe nach den Abstand zur Sprachquelle, dem Mund, verändert.
Legt man also das Headset zur Seite und wird dadurch der bewegliche Mikrofonarm bewegt, also dessen Stellung verändert, braucht man, nachdem man das Headset aufgesetzt hat, nur noch die ursprüngliche Höhe einzustellen, die man einfacherweise an die Stellung (Höhe) der Lippen anpasst.
Da mein PC links unterhalb meines Schreibtisches steht und die Entfernung relativ groß ist, habe ich mir ein zweiadriges Verlängerungskabel gekauft und angeschlossen. Dieses Verlängerungskabel endet ungefähr an der Schreibtischkante, wo ich es fixiert habe. Daran angeschlossen ist das eigentliche Kabel des Headsets, das einadrig ist (natürlich mit zwei "Seelen") und, wie ausgeführt, sehr leicht ist.
Dadurch erreiche ich trotz des Kabels eine relativ große Beweglichkeit. Ich kann aufstehen, ich kann weiter entferntere Unterlagen holen etc.
Kurzum, ich bin sehr zufrieden und der tägliche Ärger bei der Arbeit wegen der Widrigkeiten des alten Headsets ist verschwunden.
Viele Grüße und allen Teilnehmern und Besuchern dieses Forums ein gutes neues Jahr, Manfred Hartmann
dann hatten sie den gleichen Effekt wie ich. Das Mikrofon muss aus dem Atemstrom herausgehalten werden. Bei den Headsets mit starrem Mikrofonarm sitzt das Mikrofon bei mir zu nah am Mund und bei einem flexiblen Mikrofonarm, da haben Sie recht, wird dieser immer wieder verstellt, wenn man das Headset aufsetzt oder abnimmt. Deshalb die Idee mit dem n-förmig gebogenen und durch Klettband fixierten Mikrofonarm. Das Foto im Anhang zeigt es ganz gut. Auf der anderen Seite des Headsets habe ich mit selbstklebenden Klettband eine ovale, einseitig mit Klett-Flausch versehene Moosgummiplatte angebracht. Dadurch wird der Druck des Headsets auch dort auf eine große Fläche verteilt.
DNS 12.5 Premium; Windows 7 Professional (64-bit) Andrea NC-181VM USB Headset Intel Core i7-2600K 4x3,40Ghz - 16 GB RAM
Angefügte Bilder:
Aufgrund eingeschränkter Benutzerrechte werden nur die Namen der Dateianhänge angezeigt Jetzt anmelden! f11t883p6399n149.jpg