Sie sind vermutlich noch nicht im Forum angemeldet - Klicken Sie hier um sich kostenlos anzumelden Impressum 
Sie können sich hier anmelden
Dieses Thema hat 2 Antworten
und wurde 77 mal aufgerufen
 Fragen zur Anwendung
AxelW Offline



Beiträge: 21

20.12.2018 13:57
RE: DPI15: Geringere Erkennungsgenauigkeit bei der Audioumsetzung Zitat · Antworten

Liebe Dragon-Benutzer,

mir ist aufgefallen, dass die Erkennungsgenauigkeit bei der Umsetzung von Audiodateien gegenüber der Erkennung beim normalen Diktieren stark abfällt.

Um auszuschließen, dass dies nur ein subjektiver Eindruck ist bzw. auf Einflüsse aus der Umgebung zurückzuführen ist, habe ich folgenden Test ausgeführt: Zunächst habe ich einen Text mit Dragon diktiert. Anschließend habe ich diesen mit der Wiedergabefunktion aus Dragon wiedergegeben und mit einem Audiorekorder aufgezeichnet. Hierdurch wurde eine .wav-Datei erzeugt (PCM, 22 kHz, 16 Bit). Diese Datei habe ich dann mit der Funktion "Aufnahme umsetzen" unter "Extras" umgesetzt. Um unnötigen Fragen vorzubeugen: Ich habe bei der Umsetzung unter der Option "Stimme" "meine Stimme" gewählt. Bei den "Optionen" habe ich die gleichen Einstellungen wie beim normalen Diktieren verwendet.

Und siehe da: Die Erkennungsqualität bei der Umsetzung der Aufnahme war tatsächlich deutlich schlechter. Fast sieht es danach aus, als ob das ganze Training (durch Korrekturen etc.) bei der Umsetzung gar nicht hinterlegt ist.

Natürlich kann man für das Umsetzen von Audiodateien einen neuen Benutzer anlegen und diesen dann anhand der Korrekturen (man erhält ja auch die .dra-Dateien) neu trainieren, aber dies wäre mit einem großen Zeitaufwand verbunden.

Muss man wirklich für die Umsetzung von Aufnahmen ein weiteres Benutzerprofil trainieren oder gibt es einen anderen Weg, um die gleiche Erkennungsgenauigkeit wie beim Live-Diktieren zu erhalten?

Ich bedanke mich bereits für alle Antworten!

R.Wilke Offline



Beiträge: 6.117

20.12.2018 18:38
#2 RE: DPI15: Geringere Erkennungsgenauigkeit bei der Audioumsetzung Zitat · Antworten

Realistischer wäre der direkte Vergleich gewesen, wenn Sie parallel in beide Geräte diktiert hätten, also sowohl in das Mikrofon bzw. Headset als auch in das Aufnahmegerät (Digitalrecorder) und die Aufnahme anschließend umgesetzt hätten, um die beiden Ergebnisse miteinander zu vergleichen.

Es trifft allerdings zu, dass für die Umsetzung, auch mit der „eigenen Stimme“, ein separates akustisches Modell angelegt wird, welches folglich noch trainiert werden muss und insofern die Korrekturen, was die akustische Seite betrifft, die man zuvor bereits beim direkten Diktat gesammelt hat, dort noch nicht zur Verfügung stehen.

Wiederum verwenden alle Diktierquellen innerhalb ein und desselben Profils das selbe Vokabular und die damit verbundenen und gesammelten Informationen.

Meine praktische Erfahrung ist aber, wenn ich auch nur selten auf ein Diktiergerät zurückgreifen muss, dass die Unterschiede kaum spürbar sind, jedenfalls nicht solange die Aufnahmen klar und deutlich sind.

_______________________________________

DPG 15.6 (15.60.200.015) auf Windows 10 Pro (64-bit)
SpeechMike Premium (LFH3500) + SpeechMike II
HP ZBook 17 G2 (Refurbished) - i7-4910qm - 8MB SmartCache - 32 GB RAM - 512 GB SSD - 1 TB HSSD - 2 TB HDD

AxelW Offline



Beiträge: 21

20.12.2018 19:10
#3 RE: DPI15: Geringere Erkennungsgenauigkeit bei der Audioumsetzung Zitat · Antworten

Danke Herr Wilke für die Rückmeldung.

Ich habe gar kein Aufnahmegerät verwendet. Vielleicht habe ich mich etwas unklar ausgedrückt. Mit dem "Audiorecorder" ist ein Programm gemeint, dass den Audiostream des Computers aufzeichnet. Da ich das interne Audioformat von Dragon (22 kHz, 16 Bit) verwendet habe, sollte es keine Unterschiede in der Audioqualität gegenüber dem direkten Diktat geben.

Inzwischen habe ich allerdings selbst noch etwas rumgespielt und etwas Merkwürdiges herausgefunden: Wenn ich die Audiodatei, die vorher mit dem Audiorecorder erstellt wurde, mit der Funktion "Autoumsetzung" statt "Aufnahme umsetzen" unter "Extras" umsetze, ergibt sich genau die gleiche Erkennung wie beim normalen Diktat. Hier wird also offensichtlich mein bereits trainiertes Profil verwendet.

So sollte es ja auch sein. Unbequemerweise läuft die "Autoumsetzung" allerdings nur, wenn Dragon vorher heruntergefahren wurde. Man kann also nicht "mal eben schnell" etwas umsetzen, sondern muss erst einmal Dragon beenden, woraufhin die Autoumsetzung loslegt. In den Hilfeinformationen von Nuance habe ich eine Stelle gefunden, in der ausgesagt wird, dass dies geschieht, um eine Beschädigung der Benutzerdaten zu vermeiden. Es scheint also tatsächlich so zu sein, dass bei Verwendung von "Aufnahme umsetzen", wobei Dragon ja hochgefahren ist, bestimmte Bereiche der Benutzerdaten ungenutzt bleiben, um eine Datenkorruption zu vermeiden.

Jedenfalls würde dies die stark abfallende Erkennungsqualität bei "Aufnahme umsetzen" erklären.

Da wird sich manch ein Benutzer wohl schon gedacht haben, dass die schlechte Erkennung beim externen Diktat auf die mangelhafte Qualität seines Aufnahmegeräts bzw. die Audiokompression zurückzuführen ist.

Ähnliche Themen Antworten/Neu Letzter Beitrag⁄Zugriffe
DPI15 schreibt unnötigen Text
Erstellt im Forum Fragen zur Anwendung von
15 17.01.2019 17:30
von P.Roch • Zugriffe: 68
Umsetzung von Voice Tracer in DPI15
Erstellt im Forum Fragen zur Anwendung von
1 13.01.2017 14:33
von R.Wilke • Zugriffe: 25
DNS 14 (DPI) Audioumsetzung und Word 2013
Erstellt im Forum Fragen zur Anwendung von
4 18.05.2016 07:47
von rc.otto • Zugriffe: 17
Dragon 10.1 - Erkennungsgenauigkeit anhand von eMails verbessern
Erstellt im Forum Fehlermeldungen von
7 18.12.2014 18:26
von R.Wilke • Zugriffe: 35
Dragon 12 Premium: die alten Fehler- - Spielzeug statt Werkzeug
Erstellt im Forum Berichte und Tipps von
55 22.03.2013 10:48
von WoPra • Zugriffe: 134
Erkennungsgenauigkeit beim Umsetzen von Diktaten
Erstellt im Forum Fragen zur Anwendung von
6 20.05.2012 23:30
von bärbel • Zugriffe: 19
Thunderbird E-Mails zur Verbesserung der Erkennungsgenauigkeit nutzen
Erstellt im Forum Fragen zur Anwendung von
3 07.10.2010 19:16
von Marius Raabe • Zugriffe: 25
6. Schritt: Diktieren und Korrigieren
Erstellt im Forum Wie mache ich das: von
0 04.04.2010 19:28
von R.Wilke • Zugriffe: 140
Glossar (in Bearbeitung)
Erstellt im Forum FAQ & Troubleshoot: von
0 06.03.2010 01:20
von R.Wilke • Zugriffe: 88
 Sprung  
Xobor Ein Kostenloses Forum | Einfach ein Forum erstellen
Datenschutz