ich benutze das System nur zum Diktieren in Word, Steuerungsbefehle überhaupt nicht.
Das Diktieren funktioniert super, besser als mit der Version 11.5. Aber beim Korrigieren fällt mir auf, wenn ich auf den geschriebenen Text klicke, dass im vorgesprochenen Audio oft noch Bruchstücke des nachfolgenden Wortes wiedergegeben werden, dafür fehlt oft der Anfang, die ersten Milisekunden des Wortes im Audio.
Kann man das irgendwie anpassen oder fixen?
Einerseits stört es, andererseits frage ich mich aber auch, ob ich, wenn ich Korrekturen anwende, das Profil verschlechtere, wenn die Audiozuordnung nicht passt.
ich benutze das System nur zum Diktieren in Word, Steuerungsbefehle überhaupt nicht.
Das Diktieren funktioniert super, besser als mit der Version 11.5. Aber beim Korrigieren fällt mir auf, wenn ich auf den geschriebenen Text klicke, dass im vorgesprochenen Audio oft noch Bruchstücke des nachfolgenden Wortes wiedergegeben werden, dafür fehlt oft der Anfang, die ersten Milisekunden des Wortes im Audio.
Kann man das irgendwie anpassen oder fixen?
Einerseits stört es, andererseits frage ich mich aber auch, ob ich, wenn ich Korrekturen anwende, das Profil verschlechtere, wenn die Audiozuordnung nicht passt.
Im Forum habe ich bisher nichts gefunden.
Vielen Dank für Eure Hilfe!
Conny
Hi Conny,
First of all please excuse me for replying to you in English but Rüdiger is currently on holiday somewhere in France. Please can you tell me what application you are using when you see this problem. If you don't understand English then please just use Google translator or perhaps some kind soul will translate for me as I know plenty of you speak English on the forum.
Hi Lindsey, thanks for your response. I hope my English works for it I've experienced this problem in MS Word and Outlook 2013. According to the German text: When correcting a new dictate and double klicking a word to play back the according audio it seems that the audio is not synchronous to the written word. The playback starts a little bit too late and it stops a few miliseconds too late so that I sometimes hear the beginning of the next, unmarked word. Additionallly, when playing back longer words it sometimes seems that a few milliseconds within the recorded voice have disappeard. However, the recognition works fine, but I fear that my corrections could be bad for the voicemodel if DNS tries to correlate my text changes to a timeshifted audio.
DNS 11.5 did not have this problem on this machine. Of course I did uninstall DNS 11.5 completely before installing DNS 13.
Thanks for any help and regards Conny
Zitat von monkey8
First of all please excuse me for replying to you in English but Rüdiger is currently on holiday somewhere in France. Please can you tell me what application you are using when you see this problem. If you don't understand English then please just use Google translator or perhaps some kind soul will translate for me as I know plenty of you speak English on the forum.
Okay Conny I think I understand. Please can you show the dragon options (Tools | Options) and choose Playback/Text to speech. Please can you click on the button near the bottom of the tab that says "Read Text" and tell me if the audio is time shifted with that. Please can you also try with DragonPad.
Then when using Microsoft Word can you try just selecting the words you wish to read using a select command e.g. "select this is a text". Make sure it first of all selects the correct text and then say "Read That" or the German equivalent. Is the audio still time shifted then?
Thanks Lindsay
Also when you are on the playback text-to-speech tab of the dragon options please can you try clicking on restore defaults.
I wouldn't be overly concerned that dragon is recording your speech data in terms of language model and acoustic data based on what you are hearing so don't worry too much about your profile having the wrong language and acoustic information, it will be fine but I understand your legitimate concern.
Thanks, Lindsey. I tried with Dragon Pad, Dictation Window and Microsoft Word.
It's the same with every application. Audio Playback is timeshifted, sometimes missing a few milliseconds of a word, TTS-Reading works fine, selecting words also works fine. Recognition is absolutely ok. I also tried it with a brand new profile - but no change.
Zitat von kadThanks, Lindsey. I tried with Dragon Pad, Dictation Window and Microsoft Word.
It's the same with every application. Audio Playback is timeshifted, sometimes missing a few milliseconds of a word, TTS-Reading works fine, selecting words also works fine. Recognition is absolutely ok. I also tried it with a brand new profile - but no change.
Regards, Conny
Okay Conny I have probably misunderstood you slightly. I thought you meant you are using the TTS engine to pay back the audio. When you do this what actually plays back is the processed audio data and not the actual recording as such. So just to clarify you are using playback to playback your own voice and not the text-to-speech engine? For example as in "playback line" (the English version)
verstehe ich das richtig, Sie führen die Korrektur eines falsch erkannten Wortes derart durch, dass nur das falsche Wort mit einem Doppelklick markiert wird? Wenn ja, dann mag der beschriebene Fehler an dieser Art der Korrektur liegen.
Wie hier im Forum bereits an anderer Stelle ausgeführt ist, wird empfohlen, nicht das falsche Wort allein zu markieren, sondern vielmehr den Cursor nur mit einem einfachen Klick an die Stelle der fehlerhaften Erkennung zu setzen und sodann die Korrektur auszulösen. Denn Dragon erkennt nicht das einzelne Wort, sondern nutzt dazu auch einige Worte davor und dahinter. Nur so können zum Beispiel semantische Dinge mit bei der Erkennungsgenauigkeit herangezogen werden.
Ich glaube nicht, dass das Profil sich verschlechtert, man macht es dem Drachen nur etwas schwerer, wenn nur ein Wort markiert wird zur Korrektur.
Probieren Sie es doch mal aus, vielleicht ist damit ihr Problem behoben.
Viele Grüße Angelika
Laptop: Intel Core 2 Duo P8700 (2,53 GHz, 3 MB L2 Cache), 4 GB RAM, Windows 7 32-Bit, DPI 15, MS Office 2007, Olympus DR-1000, Samson GoMic PC: Intel i5, Windows 7 64-bit, Dragon NaturallySpeaking 13 Prof, MS Office 2013
ich kann bzw. muss den von Conny beschriebenen Effekt bestätigen: unabhängig davon, ob ein Wort oder mehrere Wörter markiert sind, ob im Verlauf der Korrektur oder nur zwecks Nachhören (Playback) ausgewählter Text wiedergegeben werden soll - oftmals stimmen der Audiopart und das Ausgewählte nicht exakt überein. Keine Abweichungen gibt es eigentlich nur dann, wenn eine komplette von Dragon erkannte Phrase wiedergegeben wird.
Ob die Korrektur durch diese Diskrepanz zwischen Playback und Markierung negativ beeinflusst wird, ist schwer zu sagen. Vielleicht kann man das durch gezielte Tests herausfinden.
Zitat von P.RochWelches Textfenster war geöffnet, in das das Diktat umgesetzt wurde? Dragon speichert keinen Text unkotrolliert irgendwohin. Dragon setzt das Diktat in Text um und überträgt diesen in das aktive Fenster. Selbstverständlich kann man direkt in Word diktieren. Dazu muss das Wordfenster allerdings auch das aktive Fenster sein, oder anders gesagt, der Cursor muss im Wordfenster blinken. Gruß, Pascal
Thanks Pascal for confirming you see the same issue.
Conny,
Possibly Rüdiger may be able to shed some light when he comes back this weekend. You could also try increasing the disc space reserved for playback on the data tab of dragon options but I have to admit I can see no direct correlation to the time shifted audio issue. I'll stick it on the KnowBrainer forum for you as well because among all the nonsense perpetrated by certain people on that forum you do get occasionally some gems of information from genuine users.
vielen Dank für die Rückmeldung. Das Problem ist, wenn ich den Cursor an die Fehlerstelle setze, wird ein sehr langer Teil des Textes wiedergelesen und (zumindest für mich) wird das Korrigieren umständlicher und kostet etwas mehr Zeit. Ich bin halt von Geburt an etwas ungeduldig. und der Doppelklick aufs Wort ermöglicht Korrekturen in Sekundenbruchteilen und stört den Arbeitsfluss nicht so sehr. Dass man besser im Umfeld des Wortes korrigert, wusste ich nicht. In bestimmten Fällen werde ich jetzt sicher mein Verhalten darauf adaptieren, aber wohl nicht immer. Auf alle Fälle danke für den Tip!
Dennoch hätte ich gerne die Funktionalität der Audiowiedergabe ohne Timeshift - sie ist für mich wichtig.
In the meantime I got confirmation from Nuance support that they can reproduce that issue. But they currently do not have a solution. They didn't want to treat this as a bug. I asked for fixing but I guess they treat it as a feature request, only. ;-(
In the meantime I got confirmation from Nuance support that they can reproduce that issue. But they currently do not have a solution. They didn't want to treat this as a bug. I asked for fixing but I guess they treat it as a feature request, only. ;-(
Let's see if Rüdiger has an idea.
Thanks and happy weekend! Konrad
That's interesting Conny what nuance had to say. I wonder if it's a bug in the German version only? I can't reproduce it here with English but it would be interesting to know what happens when you load an English profile with the German version. Do you still get the problem?
Dass Audio und markierter Text nicht mehr synchron sind, wenn mittels Doppelklick korrigiert wird, ist meiner Erinnerung nach zum ersten Mal in Version 12 aufgetreten. Aber nur in dem Zusammenhang - also bei der Korrektur mittels Doppelklick -, nicht etwa, wenn die Markierung nur wiedergegeben wird.
Für den inneren Zusammenhang zwischen Audio und Text dürfte das, aus diesem Grund, keine negative Auswirkung haben.
Meine Empfehlung wäre, entweder damit zu leben, oder besser noch, die automatische Wiedergabe bei der Korrektur ganz abzuschalten. Damit spart man nämlich noch mehr Zeit.
_______________________________________
Dragon Professional 16 auf Windows 10 Pro und Windows 11 SpeechMike Premium (LFH3500); Office 2019 Pro + Office 365 (monatliches Abo) HP ZBook Fury 17 G8 - i7-11800H - 24 MB SmartCache - 32 GB RAM - 1 TB SSD
Hallo Rüdiger, wie schon gesagt, die Audiowiedergabe ist insofern für mich wertvoll, weil ich bei längeren Diktaten nicht mehr unbedingt weiss, was ich an dieser Stelle gesagt hatte oder die Aussprache nochmal verifizieren will.
Aber wenn Nuance diesen Fehler schon in der Version 12 nicht gefixed hat, stehen die Chancen wohl nicht so gut, dass jetzt irgendwann mal ein Bugfix kommt. Ich finde das schon ärgerlich, dass so ein klar offensichtlicher Fehler einfach im Produkt gelassen wird. Immerhin - wenn die Korrektur trotzdem ordentlich funktioniert und das Sprachmodell nicht geschädigt wird, ist das ja auch schon was wert.
Vielen Dank auf alle Fälle fürs Feedback. Jetzt weiss ich zumindest, dass sich eine weitere Fehlersuche nicht lohnt.