Hallo. Ich diktiere schon lange mit dragon 9-10-11 version. Grosses Voksbular, backup2 nur audio.dat, dra-files einige gb. Mein Profil hat aber insgesamt 11,6, gb. Was kann ich machen, um auf ein vernünftiges Mass zu kommen? Danke, drmille
Um die Frage beantworten zu können, bräuchten wir noch ein paar mehr Informationen, zum Beispiel:
Wie viele Audioquellen? Neues Profil angelegt oder Ugrade eines alten Profils? Wie groß ist das akustische Archiv (die Dateien acarchive.nwv und aooutcast.nwv)?
Gruß, R. Wilke
_______________________________________
Dragon Professional 16 auf Windows 10 Pro und Windows 11 SpeechMike Premium (LFH3500); Office 2019 Pro + Office 365 (monatliches Abo) HP ZBook Fury 17 G8 - i7-11800H - 24 MB SmartCache - 32 GB RAM - 1 TB SSD
Hallo Herr Wilke, danke für Antwort. Ich habe mein 10.1 Profil "upgedatet". Ich habe ein paar logfiles angefügt, ich meine es ist nur eine Audioquelle aktiv, Speechmike.
16:24:07 Starting C:Program Files (x86)Philips SpeechDevice Control CenterPDCC.exe 16:24:07 Dragon NS ActiveX Components: File C:Program Files (x86)NuanceNaturallySpeaking11Programdnstk10.dll: Version 11.00.200.090 16:24:08 Starting process C:Program Files (x86)NuanceNaturallySpeaking11Programnatspeak.exe (DEU) 16:24:08 [x64] (UIAServer) Identity: S-1-5-21-4210986853-2733291206-3088083132-1000:Dragon.UiaServer64 16:24:08 [x64] (UIAServer) Info: The server has started with Integrity Access Level: 16:24:09 LOG (MainWin): Windows user has administrative access to NatSpeak 16:24:09 Dragon NaturallySpeaking Version 11.00.200.090 16:24:09 OS: Windows 7 build 7600 64-bit 16:24:09 Locale: 407 16:24:09 Multimedia: Mikrofon (SpeechMike III)(65535.65535) 16:24:09 Marshaler: Microsoft, Version 4.0.4.2512
[Settings] System Has Sound Card=1 Current User=.NoSpeaker Language and Dialect=4,1 Last Used User=Dr.XXXX (v11) Last DragonBar Last Floating Mode Position=0,0,1600,31 deu Tips File TimeStamp=Thu Aug 12 15:36:12 2010 User Base Directory=C:ProgramDataNuanceNaturallySpeaking11Users User Base Directory RU=C:ProgramDataNuanceNaturallySpeaking11Users Last Speaker=Dr.XXXXX (v11 Last Export Location=T:reserveXXXXX (v11) Show Failure Report For Periodic Tasks=4 UserTopicsMRU=Innere_Medizin UserAcousticsMRU=-65536 UserMRU=C:ProgramDataNuanceNaturallySpeaking11UsersXXXXX (v11) Is Dictation Available=1
[.GlobalGlobal Dictation Level] _WwG=-2
acarchive.nwv ist 1.633.112 kb groß aooutcast.nwv ist 10.116 kb groß. drafiles-Ordner 3,6GB
Ich vermute, das Problem stammt aus dem Update des Profils von der Version 10 (möglicherweise war dieses sogar seinerseits noch von Version 9 importiert). In der Version 10 gab es manchmal Riesenprofile, ich hatte auch mal so eines. Das Profil-Update sollte man ohnehin niemals machen (nach allgemeiner Experten-Meinung ist es nur ein Marketing-Gag, dass es diese Option überhaupt gibt), und wenn schon ein Update, dann nur, um anschließend das Vokabular in ein neues Profil exportieren zu können (entsprechende professionelle Edition von Dragon vorausgesetzt).
Also, meine Empfehlung wäre wie folgt vorzugehen: Aus dem gegenwärtigen Riesen-Profil einmal das Vokabular exportieren und zusätzlich noch eine Liste aller benutzerdefinierter Wörter. Dann in Version 11 einen neuen Benutzer anlegen, Kurztraining durchführen und das Vokabular importieren (hilfsweise die Liste benutzerdefinierter Wörter).
Schließlich noch zum Vergleich: Mein Profil, mit dem ich seit September 2010 in Dragon 11 arbeite, ist aktuell 2,2 GB groß, das akustische Archiv umfasst in der Datei acarchive.nwv ca. 676 MB, die Datei aooutcast 10.9 MB. Diese Werte können aber ziemlich stark schwanken zwischen den Benutzern. Sie werden davon abhängen, wie viele Korrekturen durchgeführt werden (was wiederum von ganz verschiedenen Parametern abhängt, etwa der Genauigkeit der Korrektur, der Präzision beim Diktat, der Schwierigkeit der Texte usw. usw. usw.), aber auch davon, wie oft die Modelloptimierung durchgeführt wird (hierbei sollen angeblich alte DRA-Dateien "konsolidiert" werden), sowie davon, ob BestMatch IV zum Einsatz kommt. Ferner hat die Diskussion hier im Forum schon ergeben, dass die Profildateien in der Version 11 schon deswegen größer sind als beim Vorgänger, weil die Sprachaufzeichnung in einer höheren Qualität erfolgt und außerdem zwei Sprachmodelle in einem gewissen Sinne nebeneinander laufen, so dass die Resultate dieses Konkurrenzkampfes im Benutzerprofil aufgezeichnet werden.
Beste Grüße, Marius Raabe
Dragon NaturallySpeaking 11.5 Legal Windows 7 Prof. 64-Bit, Office 2010, Jarte Plus Philips SpeechMike II Pro Plus, SpeechMike III, SpeechMike Air, PDCC 2.8 Intel Core2 Quad Q9550, 2,83 GHz, 2x6MB L-2, 8 GB RAM
Hallo, danke für die Nachricht. Die Problematik mit dem User Profil war mir schon bekannt. Ich habe aus diesem Grunde auch tatsächlich mit einer nackten Version 11 angefangen, Vokabular importiert. Dabei war aber nach einigen Tagen die Fehlerhäufigkeit deutlich schlechter als mit der alten 10.1, und zwar ausgeprägt. Ich habe deshalb Profil "upgedatet", was erheblich bessere Ergebnisse lieferte. Aber eben die Größe wuchs und wuchs. Und jetzt? Danke, Rechbauer
Also, so etwas höre ich zum ersten Mal ... Die Kritikpunkte an Version 11 betrafen alles mögliche, nie aber die Erkennungsgenauigkeit. Vielleicht liegt es an dem medizinischen Fachvokabular
Wenn alle Stricke reißen und das aufgeblähte Profil weiterverwendet werden soll (so lange, wie es noch läuft...), lässt sich weitere Gewichtszunahme vielleicht noch vermeiden, indem die Option "Korrekturen im Archiv speichern" deselektiert wird. Aber 11 GB sind definitiv einfach zu viel.
Grüße, Marius Raabe
Dragon NaturallySpeaking 11.5 Legal Windows 7 Prof. 64-Bit, Office 2010, Jarte Plus Philips SpeechMike II Pro Plus, SpeechMike III, SpeechMike Air, PDCC 2.8 Intel Core2 Quad Q9550, 2,83 GHz, 2x6MB L-2, 8 GB RAM
Bei drmille umfasst das akustische Archiv ca. 1,55 GB, zusammen mit den DRA-Dateien von ca. 3,6 GB, und das alles mal zwei (current und backup) kommt man also auf mehr als 11 GB.
Dass aber die DRA-Dateien so anwachsen hängt entweder damit zusammen, dass er entweder die akustische Optimierung nicht durchführt, denn dabei werden sie gelöscht bzw. umgewandelt und dabei im Umfang wesentlich reduziert, oder es sind noch Reste aus der Vorzeit (vor dem Upgrade), die jetzt nicht mehr verarbeitet werden, so vermute ich wenigstens.
Das akustische Archiv kann nur anwachsen, wenn bei der Meldung bzw. der Frage, ob das Archiv vergrößert werden soll, mit "Ja" geantwortet wird. Die Archivgröße von 180 Minuten ist bei ca. 480 MB erreicht. Mehr braucht man aber eigentlich nicht, denn optimaler als optimiert geht nun mal nicht (dämliche Anpassung im Deutschen an eine noch dämlichere Idee aus dem Anglo-Amerikanischen).
Also entweder lebt er damit, oder er löscht die DRA-Dateien, oder er deaktiviert die Funktion, wie Marius schon sagte, "Korrekturen im Archiv speichern", oder er fängt noch mal von vorne an - was ich an seiner Stelle machen würde.
War der (das?) Upgrade eines Profils schon in den Vorversionen fraglich, gilt das meines Erachtens bei Version 11 insbesondere deshalb, weil sich die Spielregeln grundlegend geändert haben: Umstellung der Abtastrate, Umstellung des Vokabulars, und meiner Einschätzung nach Umstellung von wesentlichen Parametern bei der Erkennung, was ich nicht belegen oder irgendwie genauer erklären kann, aber sehr deutlich "fühle" - woraus dann folgt, dass die Version 11 ein wenig anders "angefasst" werden will, was vielleicht so interpretiert wird, sie sei ungenauer als Version 10.
Meine 2 Cent. Rüdiger
_______________________________________
Dragon Professional 16 auf Windows 10 Pro und Windows 11 SpeechMike Premium (LFH3500); Office 2019 Pro + Office 365 (monatliches Abo) HP ZBook Fury 17 G8 - i7-11800H - 24 MB SmartCache - 32 GB RAM - 1 TB SSD
Hallo, vielen Dank für die Antworten. Ja, meine Korrekturen werden im Archiv gespeichert. Ich führe häufig Optimierung und Anpassung durch, d.h. früher fast täglich, jetzt zweimal in der Woche. Problem: Seit einiger Zeit funktioniert die akustische Optimierung nicht mehr, Dragon will von mir ungefähr 400.000 s (das sind meines Erachtens 100 h) zusätzliches Training…. Ich habe ein recht spezifisches Vokabular, das macht es dem Programm meines Erachtens eher etwas einfacher. Ich spreche recht akzentuiert, dafür schnell und habe eigentlich sehr gute Ergebnisse. Wenn ich keine neuen Begriffe benutze liege ich bei fast 100 % Erkennung. Aber eben jetzt das Problem mit dem großen Profil. Ich habe sehr viele Sicherungen, so dass nicht viel passieren kann. Ich habe aber jetzt dennoch noch einmal neu angefangen (neues Profil, dann Vokabular, dann benutzerdefinierte Wörter) und im Moment zufrieden stellende Ergebnisse bis auf bestimmte Formulierungen, die ich mittels Training anlegen musste ("E' im TDI"). Diese klappen mit dem neuen Profil noch nicht. Aber ich habe jetzt zumindest ein besseres Gefühl. In diesem Absatz waren jetzt nur 2 Fehler (Klappen gross und eben E´ im TDI). Vielen Dank. Rechbauer
Ich nehme an, dass da einfach einiges durcheinander geraten ist, wodurch die Optimierung nicht mehr funktionierte und das Profil angeschwollen ist. Besser ist es also, dann noch mal von vorne anzufangen. Was ich nicht verstehe: wenn schon das Vokabular importiert ist, wozu dann noch die benutzerdefinierten Wörter, oder handelt es sich hier um ein Dritt-Anbieter-Vokabular?
Um Ausdrücke wie "E' im TDI" nicht mehr trainieren zu müssen, bietet es sich an, eine gesprochene Form zu hinterlegen, die die Aussprache umschreibt, zum Beispiel:
eh im te de ih
Die würde dann beim Export/Import der benutzerdefinierten Wörter mitgenommen.
Gruß, R. Wilke
_______________________________________
Dragon Professional 16 auf Windows 10 Pro und Windows 11 SpeechMike Premium (LFH3500); Office 2019 Pro + Office 365 (monatliches Abo) HP ZBook Fury 17 G8 - i7-11800H - 24 MB SmartCache - 32 GB RAM - 1 TB SSD
Hallo, bei mir ehh strich imteehdeeiih besser. Aber wie gesagt, ich spreche schnell. Gefällt mir, dass Ihrerseits Interesse besteht, ich finde Spracherkennung nämlich auch faszinierend. Gruss RECHBAUER
Ja, "Interesse" besteht. Allerdings, ob die gesprochene Form mit oder ohne Leerschritte dazwischen geschrieben wird, macht keinen Unterschied für die Erkennung. Die Leerschritte werden sowieso geschluckt. Aber egal, Hauptsache es geht.
Gruß, R. Wilke
_______________________________________
Dragon Professional 16 auf Windows 10 Pro und Windows 11 SpeechMike Premium (LFH3500); Office 2019 Pro + Office 365 (monatliches Abo) HP ZBook Fury 17 G8 - i7-11800H - 24 MB SmartCache - 32 GB RAM - 1 TB SSD
die Theorie, dass das Archiv maximal 180 min groß wird, glaube ich noch nicht so ganz: hier die Daten aus meiner aco.ini:
[voice] AO Archive Size Millisecs=15647823 AO Processed Archive Size Millisecs=15523350 AO Processed Data Size=18029 AO Enc Archive Size Millisecs=0 AO Session Size Millisecs=17770 AO Enc Session Size Millisecs=0 AO Archive Dra Position=0 AO Archive No Dra=0 AO Sample Rate=22050 AO Audio data limit hit=0 AO Audio dra size=83059 AO New Data=1 AO New Dra Data=1 AO Last Roaming Session=0
[8 1] AO Archive Size Millisecs=338040 AO Processed Archive Size Millisecs=0 AO Processed Data Size=0 AO Enc Archive Size Millisecs=0 AO Session Size Millisecs=0 AO Enc Session Size Millisecs=0 AO Archive Dra Position=0 AO Archive No Dra=0 AO Sample Rate=16000 AO Audio data limit hit=0 AO Audio dra size=14892 AO New Data=1 AO New Dra Data=0 AO Last Roaming Session=0
Schon für die Hauptdiktierquelle ist das Archiv somit umgerechnet ca. 260 min groß, bei einem Multiplikator von 2,6 (1,3 * 2 für BestMatchIV/Multipass) passt das zur Größer meiner acarchive.nwv von 678 MB (dra-files sind unauffällig bei 134 MB, also kein Raabe-Syndrom wie damals...). Mit den sonstigen Dateien und dem Backup komme ich dann alles in allem auf 2,2 GB.
Fazit: Das Archiv wächst weiter, ab und an werde ich auch um Zustimmung zur Vergrößerung gebeten (der Button für die Archivgröße ist auch schon längst ausgegraut...).
Gruß, Marius
Dragon NaturallySpeaking 11.5 Legal Windows 7 Prof. 64-Bit, Office 2010, Jarte Plus Philips SpeechMike II Pro Plus, SpeechMike III, SpeechMike Air, PDCC 2.8 Intel Core2 Quad Q9550, 2,83 GHz, 2x6MB L-2, 8 GB RAM
ZitatFazit: Das Archiv wächst weiter, ab und an werde ich auch um Zustimmung zur Vergrößerung gebeten (der Button für die Archivgröße ist auch schon längst ausgegraut...).
Marius,
habe ich irgendwo das Gegenteil gesagt? - Dazu noch mal der Text aus der Dragon-Hilfe:
ZitatArchivgröße
Klicken Sie auf die Schaltfläche "Archivgröße", um die Archivgröße für die akustischen Daten zu ändern, indem Sie im Dialogfeld "Archivgröße" den Schieberegler bewegen. Der Anfangsbereich zur Speicherung akustischer Daten liegt zwischen 30 und 180 Minuten. Zur Verbesserung der Genauigkeit verwendet Dragon jetzt eine Abtastfrequenz von 22 kHz anstelle von 11 kHz. Dragon verwendet nur die niedrigere Frequenz, wenn Ihre Sound-Karte dies erfordert.
Wenn Sie die Grenze der Archivgröße erreichen, fordert Dragon Sie auf, ob Sie den Wert um 30 Minuten erhöhen möchten. Es folgen einige Beispiele, wie viel Festplattenspeicher für verschiedene Abtastfrequenzen benötigt wird:
Akustische Daten Abtastfrequenzen und erforderlicher Festplattenspeicher
Wenn Sie den Höchstwert der Archivgröße erreichen oder überschreiten, fordert Dragon Sie auf, diesen Wert zu erhöhen. Wenn Sie "Nein" wählen, fügt Dragon keine neuen Korrekturen zum Archiv hinzu.
Grüße, Rüdiger
_______________________________________
Dragon Professional 16 auf Windows 10 Pro und Windows 11 SpeechMike Premium (LFH3500); Office 2019 Pro + Office 365 (monatliches Abo) HP ZBook Fury 17 G8 - i7-11800H - 24 MB SmartCache - 32 GB RAM - 1 TB SSD
Zitat Die Archivgröße von 180 Minuten ist bei ca. 480 MB erreicht. Mehr braucht man aber eigentlich nicht, denn optimaler als optimiert geht nun mal nicht (dämliche Anpassung im Deutschen an eine noch dämlichere Idee aus dem Anglo-Amerikanischen).
Mea maxima culpa, das habe ich wohl falsch interpretiert. Danke auch für den impliziten Hinweis, dass natürlich die erhöhte Abtastfrequenz den höheren Faktor bedingt (war ein harter Tag, äh, äh, stotter, schäm) .... Die Frage bleibt aber, ob der zweite Teil deiner Einlassung so richtig ist. Hast du nach 180 Minuten denn auf Nein gestellt und die akustische Optimierung eingestellt? Allgemein wird ja empfohlen, die Optimierung nicht auszulassen - was mir plausibel erscheint, da sich ja mit der Zeit auch Sprachgewohnheiten ändern können (Worthäufigkeiten auch) - wieso sollte das ab 180 Minuten anders sein? Ich meine, dass "optimiert" sich daher immer nur auf einen bestimmten Zeitpunkt in der Nutzungsgeschichte des Modells beziehen kann. Daher lasse ich ihn wohl erst mal weiter wachsen, den Drachen. Ich frage mich, ob es nicht eine Option geben sollte, das Archiv zu löschen und mit dem gleichen Profil die Optimierung neu anzufangen..., bzw. ob nicht die acarchive.nwv genauso konsolidierbar sein sollte wie die dra-files.
Beste Grüße, Marius
Dragon NaturallySpeaking 11.5 Legal Windows 7 Prof. 64-Bit, Office 2010, Jarte Plus Philips SpeechMike II Pro Plus, SpeechMike III, SpeechMike Air, PDCC 2.8 Intel Core2 Quad Q9550, 2,83 GHz, 2x6MB L-2, 8 GB RAM
der "zweite Teil meiner Einlassung" war nicht so ganz ernst gemeint und eher Ausbruch meiner Allergie gegen um sich greifenden Optimierungswahn und damit einhergehende Sprachverhunzung.
Nein, ich sammele auch weitherin treu und brav meinen Korrekturen und führe hin und wieder eine "Optimierung" durch, wenngleich ich der Meinung bin, dass der "optimale" Zustand des Profils, was die Anpassung an die Sprechart des Anwenders/der Anwenderin betrifft, schon relativ früh erreicht ist, oder sein sollte.
Leider aber gibt es nirgends gesichertes öffentlich publiziertes Wisssen darüber, was da genau geschieht und wie die einzelnen Teile zusammen hängen. Damit meine ich nicht, was sich der ein oder andere darunter vorstellt, oder die bekannten Allgemeinplätze darüber, sondern wie es wirklich ist.
Grüße, Rüdiger
_______________________________________
Dragon Professional 16 auf Windows 10 Pro und Windows 11 SpeechMike Premium (LFH3500); Office 2019 Pro + Office 365 (monatliches Abo) HP ZBook Fury 17 G8 - i7-11800H - 24 MB SmartCache - 32 GB RAM - 1 TB SSD