Entsprechend den Empfehlungen hier im Forum und weil ich auch in den letzten Monaten in meiner Kanzlei sehr viel zu tun hatte, sind die Frequenzen, innerhalb derer ich Genauigkeitsoptimierungen durchführe, seltener geworden. Das liegt vor allem daran, weil DNS mir gleich fast 3 h Optimierungszeit anzeigt und dann tatsächlich auch ca. 2 h zur Optimierung benötigt. Ich muss das also anstellen, wenn ich weiß, für die nächsten 2-3 h nicht diktieren zu wollen. Das ist seltener geworden.
Nach der letzten Optimierung ergibt sich nun das Phänomen, dass DNS das Wort "Gruß" nicht mehr versteht. DNS versteht das jetzt als den Befehl "groß" und schreibt dann das nächste Wort eben einfach groß. Das ist ein bisschen lästig und ich weiß gar nicht so genau, wie ich das wieder korrigieren kann. Hat jemand anderes solche Optimierungsergebnisse auch?
Gruß (was ich jetzt buchstabiert habe, damit es geschrieben wird!)
A. Wagner
[Dragon Legal Anywhere mit SpeechMIke LFH 3510, Intel(R) Core(TM)I7-7500 CPU, 16 GB RAM, Windows 10 Pro. 64 Bit [/i]
Die Durchführung der Genauigkeitsoptimierung dauert bei mir auch so bummelig 2 Stunden, bei einer Profilgröße von etwa 3 GB (brutto, also inklusive Backup). Auch ist es ziemlich normal, dass die Prognose der Zeitdauer äußerst unpräzise ist. Ich lasse das gerne mal laufen, wenn ich einen Auswärtstermin wahrnehme.
Ob die Genauigkeitsoptimierung tatsächlich bei jedem Durchlauf hält, was sie verspricht, also eine Verbesserung, ist sicher eine Frage, die geeignet ist, manchen einen Kriegsgrund für einen der vielen Glaubenskriege rund um Dragon NaturallySpeaking zu liefern. Da die Software dem Nutzer jedenfalls beim Umgang mit stochastischen bzw. statistischen Prozessen einiges voraus hat – mit anderen Worten eine präzise statistische Auswertung vorher/nachher für den Nutzer nahezu ein Ding der Unmöglichkeit ist –, wird hier oft mit der „gefühlten Erkennungsgenauigkeit“ gearbeitet.
Meine persönliche „Glaubensüberzeugung“ ist, dass die Genauigkeitsoptimierung bei einem jungen Profil anfänglich viel bringt und der Nutzen dann so etwa im Sinne einer Grenznutzenfunktion irgendwann nachlässt, es aber gleichwohl sinnvoll ist, von Zeit zu Zeit den Prozess durchlaufen zu lassen, und sei es nur, um die Dateien zu „konsolidieren“. Jedenfalls meine ich auch schon beobachtet zu haben, dass nach einer Optimierung bestimmte schwierige Problemfälle der Erkennung eine Zeit lang falsch aufgelöst werden. Vgl. auch hier:
In den Vorversionen vor 11 kam das meines Erachtens aber deutlich häufiger vor als jetzt.
Das Wort „“ – eben, da war es wieder, „Gruß“ gesagt, „groß“ verstanden – ist wegen seiner Ähnlichkeit mit einem überaus wichtigen Inline-Befehl (welcher war es doch gleich ) eine schwierige Nuss, vor allem, wenn das Wort einzeln gesagt wird. „Mit freundlichem Gruß“ sollte demgegenüber nie ein Problem sein. Wenn man es unbedingt sparsam mag, was die Freundlichkeitsbezeugung angeht, sollte man zumindest das nachfolgende Komma und den Namen in einer einzigen Äußerung sprechen, damit der Drache wenigstens etwas Kontext zur Verfügung hat.
Was bleibt mir noch zu sagen, außer:
Gruß, Marius Raabe
Dragon NaturallySpeaking 11.5 Legal Windows 7 Prof. 64-Bit, Office 2010, Jarte Plus Philips SpeechMike II Pro Plus, SpeechMike III, SpeechMike Air, PDCC 2.8 Intel Core2 Quad Q9550, 2,83 GHz, 2x6MB L-2, 8 GB RAM
Zitat von Marius RaabeDa die Software dem Nutzer jedenfalls beim Umgang mit stochastischen bzw. statistischen Prozessen einiges voraus hat – mit anderen Worten eine präzise statistische Auswertung vorher/nachher für den Nutzer nahezu ein Ding der Unmöglichkeit ist –, wird hier oft mit der „gefühlten Erkennungsgenauigkeit“ gearbeitet.
Nicht nur "nahezu", sondern absolut.
Groß, Rüdiger
_______________________________________
Dragon Professional 16 auf Windows 10 Pro und Windows 11 SpeechMike Premium (LFH3500); Office 2019 Pro + Office 365 (monatliches Abo) HP ZBook Fury 17 G8 - i7-11800H - 24 MB SmartCache - 32 GB RAM - 1 TB SSD
Aber würde es nicht mit dem folgenden Experiment zumindest näherungsweise gehen?
1) Man tippt einen schwierigen und langen Text mit jeder Menge „Problemfällen der Erkennung“ und lässt den Text von Dragon auf unbekannte Wörter analysieren. Diese werden dem Vokabular hinzugefügt (ohne Schreibstilanpassung). Das Benutzerprofil wird gespeichert und ein Backup angelegt.
2) Der Benutzer nimmt den Text mit einem guten Diktiergerät als DS2-Datei oder sonst mit einem Audiorecorder auf. Gut abspeichern!
3) Dann lässt man die Aufnahme von Dragon umsetzen und wertet sorgfältig die Zahl der Erkennungsfehler aus (am besten auch als Word-Datei speichern für einen späteren Dokumentvergleich). Keine Korrekturen vornehmen.
4) Dann wird das Benutzerprofil geschlossen, ohne gespeichert zu werden (um Silent-Adapt- bzw. OUFA-Effekte auszuschließen).
5) Nunmehr wird das Benutzerprofil wieder geöffnet und die Genauigkeitsoptimierung durchgeführt. Am Ende speichern!
6) Nun lässt man die alte Aufnahme erneut umsetzen und zählt/vergleicht anschließend die Fehler.
7) Benutzerprofil schließen, ohne zu speichern.
8) Nach einer Woche Benutzung des "optimierten Profils" den Text nochmal umsetzen lassen (ich glaube nämlich, Optimierungs-Verschlimmbesserungen renken sich schnell wieder ein).
Was meinst du? Hält das dragonologischen Ansprüchen stand?
N.N.
Dragon NaturallySpeaking 11.5 Legal Windows 7 Prof. 64-Bit, Office 2010, Jarte Plus Philips SpeechMike II Pro Plus, SpeechMike III, SpeechMike Air, PDCC 2.8 Intel Core2 Quad Q9550, 2,83 GHz, 2x6MB L-2, 8 GB RAM
Zitat von Marius RaabeWas meinst du? Hält das dragonologischen Ansprüchen stand?
Mit Sicherheit ganz nah dran, aber woher weißt Du das?
JG
_______________________________________
Dragon Professional 16 auf Windows 10 Pro und Windows 11 SpeechMike Premium (LFH3500); Office 2019 Pro + Office 365 (monatliches Abo) HP ZBook Fury 17 G8 - i7-11800H - 24 MB SmartCache - 32 GB RAM - 1 TB SSD
Zitat von JGMit Sicherheit ganz nah dran, aber woher weißt Du das?
JG
Was heißt hier "weißt", Joel? Falls ich es weiß, habe ich es bestimmt von dir gelernt, kann mich nur an die Fundstelle nicht mehr erinnern..., aber sicher dein Patent.
K.T. z. G.
Dragon NaturallySpeaking 11.5 Legal Windows 7 Prof. 64-Bit, Office 2010, Jarte Plus Philips SpeechMike II Pro Plus, SpeechMike III, SpeechMike Air, PDCC 2.8 Intel Core2 Quad Q9550, 2,83 GHz, 2x6MB L-2, 8 GB RAM
wie ich bereits an anderer Stelle mal berichtet habe, führt bei mir die Sprachmodell-Optimierung zu einer wesentlichen Verschlechterung. Ich führe deshalb in regelmäßigen Abständen (ca. zwei Wochen) nur die Akustik-Optimierung durch, die ca. 20 min beansprucht.
Als ich mal nichts besseres zu tun hatte, habe ich eine Sicherheitskopie des Profils erstellt und danach die Sprachmodell-Optimierung durchgeführt. Es traten danach sehr viele Fehler auf. Vor allem mein Standardsatz: "Den anliegenden Schriftverkehr übersende ich mit der Bitte um Kenntnisnahme, der Bitte um Prüfung sowie der Bitte um Rücksprache. Zudem bitte ich um Ausgleich der anliegenden Kostenrechnung." enthielt derart viele Fehler (vor allem war das Wort "Bitte" meist falsch - weil klein oder groß geschrieben), dass ich die Sicherheitskopie sofort wieder installierte.
Aber da mögen die Erfahrungen der Anwender jeweils verschieden sein. Ich werde jedenfalls keine Sprachmodell-Optimierung mehr durchführen und spare dabei auch noch einige Zeit
Zitat von RA-BehnkeAber da mögen die Erfahrungen der Anwender jeweils verschieden sein. Ich werde jedenfalls keine Sprachmodell-Optimierung mehr durchführen und spare dabei auch noch einige Zeit
Kann ich nachvollziehen. (Das ist aber auch ein Mördersatz.)
R. Wilke
_______________________________________
Dragon Professional 16 auf Windows 10 Pro und Windows 11 SpeechMike Premium (LFH3500); Office 2019 Pro + Office 365 (monatliches Abo) HP ZBook Fury 17 G8 - i7-11800H - 24 MB SmartCache - 32 GB RAM - 1 TB SSD
Zitat von Marius RaabeFalls ich es weiß, habe ich es bestimmt von dir gelernt, kann mich nur an die Fundstelle nicht mehr erinnern..., aber sicher dein Patent.
Nicht ganz mein Patent. Es ist ein schon vor langer Zeit gesetzter Grundsatz der Forschung, dass die Leistungsfähigkeit eines Erkenners (Erkennungsgenauigkeit) nur an untrainiertem Material getestet werden kann (es gibt "Vokabularbauer", die das aber nicht wissen).
Spezielle Textbelege habe ich gerade nicht, könnte ich aber nachliefern, fall nötig, allerdings nehme ich an, die Idee leuchtet ein.
Ersatzweise dazu ein paar Auszüge aus SDK-Hilfstexten zum Thema "Wie baut man ein angepasstes Vokabular".
Zitat Creating a benchmark for testing
You should perform testing before and after you create your vocabulary. Prior to creating a vocabulary, you should dictate several source documents to create a benchmark to test your vocabulary against later.
After you dictate, you should set the test documents aside. Do not use them when you build your vocabulary with Dragon NaturalVoc Tool.
To create a benchmark for testing:
Using Dragon NaturallySpeaking Professional, dictate a few of your source documents that each contain about one to three thousand words. Do not make corrections.[/*]
Record the number of errors in the text, noting the words and phrases that Dragon NaturallySpeaking Professional does not recognize. You do not need to make corrections at this time.[/*]
Do not save your speech files. Saving your speech files may negatively impact future testing.[/*]
Save the test documents, but do not use them when building your vocabulary. You will use these documents when testing the vocabulary you create with Dragon NaturalVoc Tool.[/*]
... Diverse Schritte später ....
Zitat Testing your new vocabulary
After you have created a vocabulary using Dragon NaturalVoc Tool, you should test it using Dragon NaturallySpeaking to evaluate the level of recognition accuracy you achieve.
To test your vocabulary:
Using Dragon NaturallySpeaking Professional, dictate the test documents that you used earlier in your benchmark testing.[/*]
Note the level of recognition accuracy that you achieve. Are your results better or worse than the first time you dictated the document?[/*]
If you are pleased with your results, you are ready to distribute your vocabulary.[/*]
If you are not pleased with your results, review your source documents and processing options, and consider where you can make improvements.[/*]
So, wem das noch nicht genügt, dem blühen die Heisenbergsche Theoreme!
Rüdiger
_______________________________________
Dragon Professional 16 auf Windows 10 Pro und Windows 11 SpeechMike Premium (LFH3500); Office 2019 Pro + Office 365 (monatliches Abo) HP ZBook Fury 17 G8 - i7-11800H - 24 MB SmartCache - 32 GB RAM - 1 TB SSD
Zitat von a.wagnerNach der letzten Optimierung ergibt sich nun das Phänomen, dass DNS das Wort "Gruß" nicht mehr versteht. DNS versteht das jetzt als den Befehl "groß" und schreibt dann das nächste Wort eben einfach groß. Das ist ein bisschen lästig und ich weiß gar nicht so genau, wie ich das wieder korrigieren kann. Hat jemand anderes solche Optimierungsergebnisse auch?
Gruß (was ich jetzt buchstabiert habe, damit es geschrieben wird!)
A. Wagner
Ich kenne dieses Problem ebenfalls, bei mir ist es allerdings von Anfang an aufgetreten. Ich habe das umgangen, indem ich Gruß als „grußkurz" diktiere, überhaupt habe ich für solche Klippen ein ganzes Arsenal an „Kunstwörtern" geschaffen, die man natürlich, wenn es überhaupt Sinn machen soll, auswendig kennen muss, aber dies ist zugleich auch ein bisschen Gehirn-Akrobatik. Spontan fällt man dieser Stelle ein, das Dragon auch stets Probleme hat mit zur Zeit (was man bekanntlich nur im historischen Sinne benutzt) und zurzeit was ich als „zurzeitzusammen" diktiere. Die größten Probleme habe ich bei Maßeinheiten, weil Dragon zwar das selbst erschaffene „Kunstwort" richtig erkennt, aber dennoch nicht richtig schreibt. Will ich 4 h als 4 Stunden schreiben (diktiert als „Stundewort" oder, wenn an dieser Stelle Dragon zickt, „Stundewortzusammen" - je länger ein Wort ist, umso höher ist die Erkennungsgenauigkeit), geschieht es durchaus, dass im Erkennungsfenster das diktierte Wort exakt erkannt gezeigt wird, und dennoch die automatische Formatierung so dominant ist, dass sie die richtige Erkennung überschreibt.
DNS 15.3 Professional Individual auf Windows 10 Home (64-bit) Plantronics PLT Savi W440 Intel (R) Core (TM) i7-7500 2,7 GHz 8 GB RAM 64 Bit
Zitat von R.WilkeSo, wem das noch nicht genügt, dem blühen die Heisenbergsche Theoreme!
Nur her damit! Meines bescheidenen Erachtens leidet die von dir zitierte Anleitung jedenfalls daran, dass nicht mit Sound-Dateien (also aufgenommenen Diktaten) gearbeitet wird. Bekanntlich – nennen wir es respektvoll ein Wilkesches Theorem, unabhängig von der Patent-Frage, wer es vielleicht noch aufgestellt hat – ist es unmöglich, dass ein Sprecher denselben Text zweimal exakt gleich diktiert.
Zitat von Harald Will ich 4 h als 4 Stunden schreiben (diktiert als „Stundewort" oder, wenn an dieser Stelle Dragon zickt, „Stundewortzusammen" - je länger ein Wort ist, umso höher ist die Erkennungsgenauigkeit), geschieht es durchaus, dass im Erkennungsfenster das diktierte Wort exakt erkannt gezeigt wird, und dennoch die automatische Formatierung so dominant ist, dass sie die richtige Erkennung überschreibt
Bei allem künstlerischen Respekt vor Kunstwörtern: Hier gibt es eine deutlich einfachere und sichere Lösung. Im Vokabular-Editor das Wort „Stunden“ aufrufen und dort die „Eigenschaften“. Dort findet sich eine „alternative Schreibweise“ „h“. Einfach das entsprechende Kontrollkästchen deaktivieren, schon werden „4 Stunden“ anstandslos als „4 Stunden“ erkannt.
Wie ihr Beitrag zeigt, hängen jedenfalls zurzeit nicht alle Problemfälle der Erkennung mit der Genauigkeitsoptimierung zusammen. Während die Erkennung des Unterschieds zwischen „Gruß“ und „groß“ meines Erachtens wesentlich von der Qualität der Aussprache (und des Mikrofons, aber das zu sagen, könnte Grund sein für einen weiteren Glaubenskrieg...) abhängt, ist der Unterschied zwischen „zurzeit“ und „zur Zeit“ akustisch schwerlich zu bewältigen, obwohl ich den Eindruck habe, dass die zusammen geschriebene Fassung eher umgesetzt wird, wenn man den ersten Wortbestandteil „zur“ betont. Auch das Sprachmodell wird hier häufig versagen. Ich habe es mit dem im Duden zur Verdeutlichung wiedergegebenen Satz „Sie ist zurzeit krank, aber sie lebte zur Zeit Karls des Großen.“ versucht. Im ersten Anlauf wurde die erste Instanz falsch geschrieben, nach Korrektur im zweiten Anlauf richtig, ganz konsistent ist das aber nicht.
Gruß, Marius Raabe
Dragon NaturallySpeaking 11.5 Legal Windows 7 Prof. 64-Bit, Office 2010, Jarte Plus Philips SpeechMike II Pro Plus, SpeechMike III, SpeechMike Air, PDCC 2.8 Intel Core2 Quad Q9550, 2,83 GHz, 2x6MB L-2, 8 GB RAM
Zitat von Marius RaabeNur her damit! Meines bescheidenen Erachtens leidet die von dir zitierte Anleitung jedenfalls daran, dass nicht mit Sound-Dateien (also aufgenommenen Diktaten) gearbeitet wird. Bekanntlich – nennen wir es respektvoll ein Wilkesches Theorem, unabhängig von der Patent-Frage, wer es vielleicht noch aufgestellt hat – ist es unmöglich, dass ein Sprecher denselben Text zweimal exakt gleich diktiert.
Völlig richtig, aber das ist hier "nur" ein Nebeneffekt, umd den es (mir) nicht geht. Nun, Heisenberg spielt hier insofern herein, als dass es in bestimmten Konstellationen zutrifft - und hier haben wir so eine -, dass bei einer Messung ein Objekt schon verändert wird und nicht mehr dasselbe ist, was es vor der Messung war. Also können wir niemals dasselbe Profil zweimal testen (oder zweimal in denselben Fluss steigen), sondern höchstens Profil A mit Profil B, B1, B2, B3 ... vegleichen, aber nicht B mit B1 ..., wenn B-B... gespeichert wurde, was wohl erfoderlich ist, damit B zu B... wird.
Also werden wir nie wissen, ob B besser oder schlechter geworden ist, höchstens wie sich B in seiner Entwicklung zu A verhält.
Zitat von Haraldüberhaupt habe ich für solche Klippen ein ganzes Arsenal an „Kunstwörtern" geschaffen, die man natürlich, wenn es überhaupt Sinn machen soll, auswendig kennen muss,
... weshalb es für mich nicht in Frage kommt und ich es nicht empfehle.
Mit freundlichem Gruß R. Wilke
_______________________________________
Dragon Professional 16 auf Windows 10 Pro und Windows 11 SpeechMike Premium (LFH3500); Office 2019 Pro + Office 365 (monatliches Abo) HP ZBook Fury 17 G8 - i7-11800H - 24 MB SmartCache - 32 GB RAM - 1 TB SSD
Zitat von R.WilkeAlso können wir niemals dasselbe Profil zweimal testen
Naja, wenn es nicht gespeichert wird, schon, sonst ist es eben in der Tat nicht mehr dasselbe, wie du richtig schreibst (hübsches Bild, das mit dem Fluss, lädt zu philosophischen Betrachtungen zu Begriff und Identität ein).
Für den Test der Auswirkungen der Optimierung müsste mein - mühseliger, von mir noch nicht praktisch durchgeführter - Versuchsaufbau aber doch ermöglichen, zwei Zustände des Profils B (B1 und B2) zu vergleichen, die sich nur durch die Optimierung unterscheiden (der Aufbau bezweckt nicht den zweimaligen Test desselben Profils, sondern die Bewertung des Unterschieds, also in diesem Sinne:
Zitatob B besser oder schlechter geworden ist
genauer: ob der Zustand B1 oder B2 besser ist.
Oder gibt es einen Denkfeher, Mr. Holmes?
What's n.
Dragon NaturallySpeaking 11.5 Legal Windows 7 Prof. 64-Bit, Office 2010, Jarte Plus Philips SpeechMike II Pro Plus, SpeechMike III, SpeechMike Air, PDCC 2.8 Intel Core2 Quad Q9550, 2,83 GHz, 2x6MB L-2, 8 GB RAM
Da habe ich jetzt aber wirklich einen Glaubenskrieg ausgelöst. In Bezug auf die Anmerkung von Benutzer Harald Schließe ich mich der Meinung von Herrn Rabe an, dass es in vielen Fällen relativ einfach ist, Erkennungsfehler dadurch zu beseitigen, dass bei den entsprechenden Wörtern alternative Schreibweisen eingestellt werden. Ich mache das ganz oft aufgrund meiner Profession mit Paragraphen und Abkürzungen für Gesetzestexte, wo dann also eine alternative Schreibweise vor oder hinter Zahlen gewählt wird. Mit dieser Methode kann ich flüssiger diktieren, ohne über Schreibweisen nachzudenken.
In Anbetracht der weitreichenden Ausführungen der Administratoren hoffe ich nun, dass ich in wenigen Monaten berichten kann, dass sich der Fehler nach ein oder zwei Optimierungen wieder aufgelöst hat.
Vielleicht klärt sich das ja auch mit dem Update auf 11.5, wenn es dann mal verfügbar sein sollte. Dabei kann ich mir allerdings jetzt schon vorstellen, dass die Profis mir hier gleich mitteilen werden, dass sich das Update wohl kaum aufs Vokabular auswirkt und deswegen nicht damit zu rechnen sein wird, die Problematik von Gruß und groß in irgendeiner Weise zu ändern. An Herrn Raabe noch der Hinweis, dass das Diktieren von Gruß in einem Satz bei mir nicht dazu führt, dass der Fehler nicht mehr auftritt. Aber mal sehen, bei dem letzten Satz ging es jetzt!
Gruß
A. Wagner
[Dragon Legal Anywhere mit SpeechMIke LFH 3510, Intel(R) Core(TM)I7-7500 CPU, 16 GB RAM, Windows 10 Pro. 64 Bit [/i]
Zitat von R.WilkeAlso können wir niemals dasselbe Profil zweimal testen
Naja, wenn es nicht gespeichert wird, schon, sonst ist es eben in der Tat nicht mehr dasselbe, wie du richtig schreibst (hübsches Bild, das mit dem Fluss, lädt zu philosophischen Betrachtungen zu Begriff und Identität ein).
Für den Test der Auswirkungen der Optimierung müsste mein - mühseliger, von mir noch nicht praktisch durchgeführter - Versuchsaufbau aber doch ermöglichen, zwei Zustände des Profils B (B1 und B2) zu vergleichen, die sich nur durch die Optimierung unterscheiden (der Aufbau bezweckt nicht den zweimaligen Test desselben Profils, sondern die Bewertung des Unterschieds, also in diesem Sinne:
Zitatob B besser oder schlechter geworden ist
genauer: ob der Zustand B1 oder B2 besser ist.
Oder gibt es einen Denkfeher, Mr. Holmes?
What's n.
Das wird schon richtig sein, wie du es sagst. Wenn die Auswirkung, die der Test möglicherweise auf das Profil hat, nicht gespeichert wird, wäre es prinzipiell möglich, verschiedene Zustände des Profils miteinander, bei Bezug auf eine externe Referenz, zu vergleichen, was jedoch notwendigerweise immer nur ein sehr kleiner Ausschnitt bleiben muss. Welche Aussagekraft damit verbunden ist, muss jeder für sich selbst entscheiden.
In der Sache ging es mir aber mehr darum herauszuarbeiten, dass sich die Qualität eines Profils, wie schon mehrfach gesagt, nur bei der Konfrontation mit unbekanntem Material erweisen kann. Aber ich denke, da sind wir uns einig.
Rüdiger
_______________________________________
Dragon Professional 16 auf Windows 10 Pro und Windows 11 SpeechMike Premium (LFH3500); Office 2019 Pro + Office 365 (monatliches Abo) HP ZBook Fury 17 G8 - i7-11800H - 24 MB SmartCache - 32 GB RAM - 1 TB SSD