Umstieg von DNS12 auf DPI15 - Mein Erfahrungsbericht:
Ich habe mir kürzlich einen neuen Rechner mit neuem DPI15 zugelegt, weil mein alter Rechner mit DNS12 in die Jahre gekommen war (10 Jahre alt).
Die Umgewöhnung und fehlende Möglichkeit die Profile sowie die Eigenschaften von benutzerdefinierten Wörtern zu übernehmen kosteten ordentlich Zeit. Geschenkt.
Irgendwann bringt man aber mit Geduld alles einigermaßen zum Laufen. So auch hier.
Leider ergibt sich weder eine spürbare Geschwindigkeitsverbesserung, noch eine spürbare Genauigkeitsverbesserung - trotz Vervielfachung von Arbeitsspeicher und SSD-Speicher und natürlich einen um mehrere Generationen neueren Prozessor.
Ich gehe derzeit davon aus, dass meine alte Installation sehr gut implementiert und trainiert war. Nach meinem Eindruck war sie eigentlich perfekt.
Das Beste zuletzt:
Kaum läuft endlich alles wieder einigermaßen, bekomme ich vor wenigen Tagen auf meinem alten Rechner im Software-Manager von DNS12 ein Upgrade-Angebot auf DPI15 für 399€ statt 699€.
Geworben wird u.a. wie folgt für DPI15:
„5 Gründe jetzt upzugraden: 1. Bis zu 15 % genauer als v14 und 26 % genauer als v13 2. Unser schnellster Dragon 3. Optimiert für Touch-Bedienung 4. Ohne Risiko 30 Tage testen 5. Sparen Sie heute 43 %“
und
„Dragon Professional Individual 15 ist die neue Dimension der Spracherkennung – 15 % genauer, neue Transkriptionsfunktionen, Optimierung für Geräte mit Touch-Bedienung und vieles mehr – mit dem neuen Dragon Professional Individual 15 arbeiten Sie jetzt noch effizienter und schneller.“
Im Kleingedruckten steht: „Das Angebot endet am 31. Dezember 2022.“ (Das Angebot stammt aus der zweiten Januarhälfte 2023.)
Aus sicherer Quelle kann ich bestätigen, dass zwischen den einzelnen Versionen durchaus Qualitätsverbesserungen hinsichtlich der Erkennungsgenauigkeit und Geschwindigkeit vorhanden sind, was sich jedoch im statistischen Bereich bewegt und sich in der Alltagserfahrung nicht unbedingt ergibt. Wir haben dazu die erforderlichen Mittel beschafft und mit unbeschreiblicher Akribie und unfassbarem Fleiß langwierige Testreihen unter quasi Laborbedingungen durchgeführt. Die von Nuance proklamierten Steigerungsraten konnten wir freilich nie nachvollziehen.
_______________________________________
Dragon Professional 16 auf Windows 10 Pro und Windows 11 SpeechMike Premium (LFH3500); Office 2019 Pro + Office 365 (monatliches Abo) HP ZBook Fury 17 G8 - i7-11800H - 24 MB SmartCache - 32 GB RAM - 1 TB SSD
Zitat von R.Wilke im Beitrag #2Die von Nuance proklamierten Steigerungsraten konnten wir freilich nie nachvollziehen.
Das habe ich mich auch oft gefragt, wie die Prozentzahlen gemessen werden. Im Grunde ginge es ja nur, indem man mit einer früheren Variante einen längeren Text von einem Tonband diktiert, dann die Fehler zählt, und das gleiche Band noch einmal das Diktat abspielen lässt und dann noch einmal die Fehler zählt. Waren es (nur als Beispiel) vorher 100 Fehler, dürften es dann nur noch rund 75 Fehler sein. Das wäre dann eine Verbesserung um 25 %.
DNS 15.3 Professional Individual auf Windows 10 Home (64-bit) Plantronics PLT Savi W440 Intel (R) Core (TM) i7-7500 2,7 GHz 8 GB RAM 64 Bit
Zitat von R.Wilke im Beitrag #2Die von Nuance proklamierten Steigerungsraten konnten wir freilich nie nachvollziehen.
Das habe ich mich auch oft gefragt, wie die Prozentzahlen gemessen werden. Im Grunde ginge es ja nur, indem man mit einer früheren Variante einen längeren Text von einem Tonband diktiert, dann die Fehler zählt, und das gleiche Band noch einmal das Diktat abspielen lässt und dann noch einmal die Fehler zählt. Waren es (nur als Beispiel) vorher 100 Fehler, dürften es dann nur noch rund 75 Fehler sein. Das wäre dann eine Verbesserung um 25 %.
Genauso haben wir es seinerzeit bei den vorerwähnten Testreihen gemacht. Grundsätzlich benötigt man einen konstanten Input, wenn man unterschiedlichen Output miteinander vergleichen will. Niemand ist in der Lage, ganz genau genommen nicht einmal ausgebildete Sprecher, dasselbe zweimal gleich zu sprechen.
Wir haben eine qualitativ hochwertige Audioaufnahme mittlerer Länge (ca. 10-15 Minuten und ca. 2500 Wörter) verwendet und den Text zuvor dahingehend bearbeitet, dass alle darin vorkommenden Wörter in einem neuen Profil bereits vorhanden sind.
Dann haben wir diese Aufnahme jeweils in neuen Profilen der älteren Version und anschließend in neuen Profilen der neueren Version umgesetzt und die Anzahl der Fehler miteinander verglichen. Dabei konnten wir ganz klar Steigerungsraten in der Erkennungsgenauigkeit zwischen den Versionen erkennen. Die exakten Zahlen habe ich nicht mehr zur Hand, das ist schon so lange her, mein Gedächtnis lässt nach und heute nehme ich mir auch nicht mehr die Zeit danach zu suchen, aber es waren sicherlich ca. 10 % oder mehr Verbesserung zwischen den Versionen zu verzeichnen.
Im zweiten Schritt haben wir dann in der neuesten Version (meiner Erinnerung nach Version 15) denselben Vergleich zwischen einem „taufrischen“ und einem schon gebrauchten aber mehrmals optimierten Profil ausgeführt und dabei festgestellt, dass durch die Optimierung noch ein paar Prozent heraus zu kitzeln sind, wenn auch nur marginal, so um die 2 %.
Wohl gemerkt, und wie schon ausgeführt, dies sind nur „statistische“ Werte, die in der Alltagssituation unter unkontrollierten Bedingungen nicht nachvollziehbar sind, oder sein müssen. Siehe Bemerkungen zum Thema „Input“ weiter oben.
Was mich aber betrifft, ich käme niemals auf die Idee, auch nur für einen einzigen Tag zu einer älteren Version zurückzukehren.
_______________________________________
Dragon Professional 16 auf Windows 10 Pro und Windows 11 SpeechMike Premium (LFH3500); Office 2019 Pro + Office 365 (monatliches Abo) HP ZBook Fury 17 G8 - i7-11800H - 24 MB SmartCache - 32 GB RAM - 1 TB SSD
Ja, sehr interessant, danke für die Antwort. Was mich wundert, dass man nicht langsam eine Variante mit Integration von KI auf den Markt bringt, also eine Erkennung, die kontextsensitiv arbeitet. Damit meine ich, die Spracherkennung erkennt am Inhalt, ob zum Beispiel „Lehre" oder „Leere" geschrieben werden muss. Die heutigen PC bieten mittlerweile so viel Rechenleistung, dass man dies meines Erachtens durchaus integrieren könnte.
DNS 15.3 Professional Individual auf Windows 10 Home (64-bit) Plantronics PLT Savi W440 Intel (R) Core (TM) i7-7500 2,7 GHz 8 GB RAM 64 Bit
Es wird ja häufig und viel darüber spekuliert, um nicht zu sagen schwadroniert, welche Modelle aktuell von Dragon verwendet werden und wie viel KI da drin steckt oder nicht. Meiner Beobachtung nach aber sind beispielsweise diese beiden Wörter heute schon relativ gut identifiziert, bei entsprechendem Kontext:
Das war mir eine Lehre, während der Lehre habe ich viel Neues gelernt, gähnende Leere, Leere im Kopf, Leere im All …
All das habe ich soeben diktiert, ohne eine einzige Korrektur, aber immer stets im Zusammenhang zwischen den Kommata.
Ach ja, und ich verwende übrigens 15.71, das nur als Hinweis, weil ich aktuell aufgrund einer bestimmten Konstellation die Erfahrung mache, dass mit 15.3 wesentlich mehr Korrekturbedarf besteht, gefühlt und aller Wahrscheinlichkeit nach auch realistisch.
_______________________________________
Dragon Professional 16 auf Windows 10 Pro und Windows 11 SpeechMike Premium (LFH3500); Office 2019 Pro + Office 365 (monatliches Abo) HP ZBook Fury 17 G8 - i7-11800H - 24 MB SmartCache - 32 GB RAM - 1 TB SSD
Zitat von R.Wilke im Beitrag #6Ach ja, und ich verwende übrigens 15.71, das nur als Hinweis, weil ich aktuell aufgrund einer bestimmten Konstellation die Erfahrung mache, dass mit 15.3 wesentlich mehr Korrekturbedarf besteht, gefühlt und aller Wahrscheinlichkeit nach auch realistisch.
Ich hätte vielleicht auch zu einer höheren Version gewechselt, aber nachdem ich gelesen hatte, das in höheren Versionen das Symbol in der Taskbar nicht mehr das komplette Menü anbietet, habe ich darauf verzichtet. Und ich nehme an, mit 15.71 hat sich das nicht geändert?
DNS 15.3 Professional Individual auf Windows 10 Home (64-bit) Plantronics PLT Savi W440 Intel (R) Core (TM) i7-7500 2,7 GHz 8 GB RAM 64 Bit