Das doppelte akustische Modell, die "Trennschärfe" und die T-Wellen

Sie können sich hier anmelden

Dieses Thema hat 8 Antworten
und wurde 116 mal aufgerufen

Fragen zur Anwendung

RE: Das doppelte akustische Modell, die "Trennschärfe" und die T-Wellen

Zitat · Antworten

Anlässlich der Beiträge von Eberhard Foerster zu seinen bisherigen negativen Erfahrungen mit dem Umstieg auf die Version 11 nach Import des bestehenden Benutzerprofils (siehe http://dragon-spracherkennung.forumprofi...776.html#p1776) habe ich einmal ein Experiment mit den Wörtern "T-Welle" und "T-Wellen" unternommen, indem ich diese einmal in meinem relativ untrainierten Benutzerprofil der Version 11 (BestMatch IV) und im Vergleich dazu in einem Profil der Version 10 (BestMatch III) aufgenommen gegeneinander getestet habe.

Das Ergebnis sieht wie folgt aus:

Zunächst ist festzustellen, dass bei Aufnahme dieser Wortformen als geschriebener Form die Version 11 darauf aufmerksam macht, dass zur besseren Erkennung eine gesprochene Form als Beigabe zu empfehlen ist, dies im Unterschied zu Version 10, wo dieser Hinweis nicht erfolgt, obwohl er nötig wäre, da sie ansonsten nicht so ohne weiteres erkannt würde.

Also habe ich in beiden Versionen eine gesprochene Form beigefügt, in Version 10 in der Form "T. Welle", in Version 11 demgegenüber "T Welle", da gesprochene Formen in der Version 11 keine Satzzeichen oder Sonderzeichen mehr akzeptieren.

Dasselbe habe ich jeweils mit den Pluralformen dieser Wörter durchgeführt. Anschließend habe ich die beiden Wörter jeweils ohne vorhergehendes Training mehrfach nacheinander in unterschiedlicher Reihenfolge und auch im Satzzusammenhang beliebig wechselnd diktiert, dies sowohl in Version 11 als auch in Version 10.

Das Ergebnis war relativ ernüchternd zumindest für diejenigen, die nach wie vor der Meinung sind, dass hinsichtlich der Effizienz dieser beiden Versionen kein Unterschied besteht oder gar wegen teilweiser auftretender, meines Erachtens jedoch individuell bedingter Probleme mit der Version 11 der Rückschritt zur Version 10 zu empfehlen sei.

Eine genaue Zählung habe ich nicht durchgeführt, aber schätzungsweise habe ich die Wörter jeweils 20 mal in beiden Versionen in der oben beschriebenen Weise diktiert. Die Grundform an sich wurde relativ problemlos erkannt, aber eine exakte bzw. zuverlässige Unterscheidung des Singulars und des Plurals war bei der Version 11 nahezu durchgängig festzustellen, eine einzige Ausnahme abgesehen, demgegenüber in der Version 10 etwa nur zur Hälfte zu erreichen.

Dies deckt sich mit den Berichten insbesondere der deutschen Anwender, dass in der neuen Version die Wortendungen wesentlich besser und zuverlässiger erkannt werden als noch in der Version 10 – meiner Meinung nach sind die Wortendungen in Version 10 Glückssache, schätzungsweise fifty-fifty –, und lässt sich letztendlich nur durch die Schlagwörter im Titel, insbesondere mit dem von Marius Raabe geprägten Begriff "Trennschärfe", erzielt durch das grundlegend verbesserte akustische Modell, hinreichend erklären.

Anwendern, die vor einem ähnlichen Problem wie Herr Förster stehen, dass ihre Wortlisten möglicherweise viele solcher zusammengesetzter Wortformen enthalten, gegebenenfalls zusätzlich noch ohne entsprechende gesprochene Formen zur leichteren Erkennung, soll dies als Hinweis dienen, sich mit diesem Problem zu befassen.

Zu erwägen wären programmatische Mittel, wie mit solchen Datensätzen verfahren werden kann, um sie für die neue Version tauglich zu machen.

Rüdiger Wilke

_______________________________________

Dragon Professional 16 auf Windows 10 Pro und Windows 11
SpeechMike Premium (LFH3500); Office 2019 Pro + Office 365 (monatliches Abo)
HP ZBook Fury 17 G8 - i7-11800H - 24 MB SmartCache - 32 GB RAM - 1 TB SSD

#2 RE: Das doppelte akustische Modell, die "Trennschärfe" und die T-Wellen

Zitat · Antworten

Rüdiger,

ich habe keine Version 10 mehr zur Verfügung. In der Version 11 habe ich die beiden gesprochenen Formen eingegeben, ohne jedes Training wurden die neuen Wörter im Singular und Plural fehlerfrei erkannt, lediglich hinsichtlich der flektierten Formen dazugehöriger Adjektive/Attribute (oder wie hieß das noch, im Gegensatz zu dir habe ich nicht Germanistik studiert, da hier folgende Beispiele: bei den einzelnen T-Wellen, einzelne T-Welle, einzelne T-Wellen) musste ich einmal korrigieren, das war's.

Bildlich gesprochen, ist meiner Meinung nach Dragon 11 der Porsche 911 unter den Spracherkennungen (bzw. den Versionen von Dragon): Man braucht ein bisschen Übung beim Einkuppeln und viel Gefühl am Gaspedal, dann aber geht's richtig ab und man lässt sowohl an der Ampel wie auf der Autobahn alle anderen ziemlich alt aussehen.

Dragon NaturallySpeaking 11.5 Legal
Windows 7 Prof. 64-Bit, Office 2010, Jarte Plus
Philips SpeechMike II Pro Plus, SpeechMike III, SpeechMike Air, PDCC 2.8
Intel Core2 Quad Q9550, 2,83 GHz, 2x6MB L-2, 8 GB RAM

#3 RE: Das doppelte akustische Modell, die "Trennschärfe" und die T-Wellen

Zitat · Antworten

Hallo Marius, das Bild mit dem Porsche 911 gefällt mir sehr gut, und um es fortzusetzen, sollte man vielleicht auch auf Anbauten aus dem Zubehör verzichten und nicht selbst anfangen zu schrauben, um ihn noch besser zu machen, und wenn er dann nicht mehr läuft, den Entwicklern die Schuld zuweisen.

Rüdiger

#4 RE: Das doppelte akustische Modell, die "Trennschärfe" und die T-Wellen

Zitat · Antworten

Genau, im Gegenteil sollte man eher das Überflüssige weglassen: Ich habe mal von einem Kollegen gehört, der hat bei seinem Sportflitzer die Rückbank ( ) ausgebaut, um schneller in die Gänge zu kommen. Übersetzt:
1. Die Dragon-Randleiste sollte man abschalten, die verbraucht nur unnötig Ressourcen.
2. Viele gleichzeitig geöffnete Word-Fenster und Internet Explorer-Fenster sind wie ein Stau auf der Drachen-Autobahn, da steht man dann auch gerne mal mit dem 911er hinter dem Fiat 500.
Aber das führt jetzt vom Thema weg…, Gruß, Marius

#5 RE: Das doppelte akustische Modell, die "Trennschärfe" und die T-Wellen

Zitat · Antworten

Du meinst, dass die Porsche-Ingenieure wohl doch ein bisschen schlauer sind als die meisten Fahrer? - Auto fahren und Fußball gucken, immer das selbe, lauter Experten unterwegs.

Rüdiger

#6 RE: Das doppelte akustische Modell, die "Trennschärfe" und die T-Wellen

Zitat · Antworten

Lieber Herr Wilke,

Ich habe mich in der Zwischenzeit noch einmal ausführlich mit den Versionen DNS 10 und DNS 11 beschäftigt. Aus meiner Sicht ist die Genauigkeit im direkten Diktat von Dragon 11 sicher kaum zu übertreffen. Bezüglich der Geschwindigkeit, in der Diktatdateien übertragen werden ergibt sich sicher ein differenzierteres Bild. In diesem Zusammenhang habe ich noch einmal 3 verschiedene Benutzerprofile aufgebaut

1.ganz neues Profil ohne Training

2.ganz neues Profil, jedoch mit Import des Vokabulars aus meiner mediz. Textsammlung, getreu nach dem Erkennungscenter „von bestimmten Dokumenten lernen“. Dabei wurden 40.000 Wörter/Wortformen importiert.

3.Profil aus DNS10 exportiert, wie vorgeschrieben, importiert, und Geschwindigkeitsoptimierung durchgeführt.

Am schnellsten und am genauesten ist das dritte Profil, wobei bei allen 3 Profilen für meinem anonymisierten Probetext (3 min.25 sek. lang, im Anhang) jeweils in Reglerstellung „schnell“ etwa 40 – 45 sek. gebraucht wurden. Die Qualität ist dabei für meinen Bedarf ausreichend, mit nur noch minimalem Korrekturbedarf.
Ohne Profilimport (wie in Version 2) ist bei dem umfangreichen Vokabular (selbst wenn dort die Hälfte aus falsch geschriebenen Wörtern oder seltenen Eigennamen bestehen sollte, ein Ergebnis wie in 3 nicht ohne massiven Aufwand zu erzielen.
Der Rechner: Acer 5741G, Intel Core i5-430M,2,26 GHz, 4 GB DDR3 Memory. Außer Dragon und Virenscanner läuft nichts parallel.

Mein alter Rechner Intel DuoCore 2 CPU 6400, 2,14 GHz, 2 GB RAM, benötigt in Position schnell etwa 30 sek., in Position genau etwa 60 sek. DieErkennungsgenauigkeit ist mt Reglerstellung schnell deutlich schlechter als bei DNS11 , in Stellung genau etwa gleich wie bei DNS 11.

#7 RE: Das doppelte akustische Modell, die "Trennschärfe" und die T-Wellen

Zitat · Antworten

Hallo Herr Förster,

ist der Probetext, mit dem Sie die Tests durchgeführt haben, auch in der Sammlung enthalten, die Sie für die Profilanpassung verwendet haben? - Wenn ja, wird dadurch das Ergebnis verfälscht.

Mein Vorschlag: Diktieren Sie noch mal einen neuen Text, nicht unbedingt sehr spezifisch, da sonst Profil 1 gar keine Chance hätte, und testen Sie noch mal mit allen drei Profilen, aber mit dem Regler immer in der mittleren Stellung.

Außerdem werde ich Ihnen noch ein von mir entwickeltes Testprogramm zusenden, und ich würde Sie bitten, dort hinein einige Sätze zu diktieren, so etwa 4 oder 5, die ich Ihnen aufschreiben werde, auch jeweils mit allen drei Profilen. Aus dem Programm heraus können Sie die Testergebnisse in einer Log-Datei abspeichern, und ich würde Sie bitten, mir die Daten zuzusenden, damit ich mir sie ansehen kann.

Danke für die Mitteilungen.

Grüße
Rüdiger Wilke

#8 RE: Das doppelte akustische Modell, die "Trennschärfe" und die T-Wellen

Zitat · Antworten

Der Diktierte Text ist erst 4 Tage alt! In meinem Profil liegt hingegen ein Ordner mit 20.000 Dateien zugrunde. Es wurde vor etwa 3 Wochen importiert! Mit freundlichen Grüßen, E.- Förster

#9 RE: Das doppelte akustische Modell, die "Trennschärfe" und die T-Wellen

Zitat · Antworten

Achten Sie bitte auf Ihren Mail-Eingang. Wenn Sie wollen, können wir die Performance (zumindest) ganz genau bestimmen. Grüße Rüdiger Wilke _______________________________________ Dragon Professional 16 auf Windows 10 Pro und Windows 11 SpeechMike Premium (LFH3500); Office 2019 Pro + Office 365 (monatliches Abo) HP ZBook Fury 17 G8 - i7-11800H - 24 MB SmartCache - 32 GB RAM - 1 TB SSD

Ähnliche Themen	Antworten/Neu	Letzter Beitrag⁄Zugriffe
DragonCapture: Tolles Programm und sehr hilfreich - aber leider nicht zu sehen. Erstellt im Forum Skripte und Zusatzprogramme von rc.otto	2	15.03.2024 16:14 von rc.otto • Zugriffe: 348
Dragon Legal Anywhere-Angebot Erstellt im Forum Berichte und Tipps von Marius_	0	16.08.2022 12:06 von Marius_ • Zugriffe: 347
Sprachoptimierung ständig / wird wohl nicht gespeichert? Erstellt im Forum Fragen zur Anwendung von egal1984	1	23.10.2021 15:13 von Marius_ • Zugriffe: 344
Vokale werden doppelt aufgeführt Erstellt im Forum Fehlermeldungen von YanSch99	1	21.06.2021 13:34 von P.Roch • Zugriffe: 242
\\ versus \ Erstellt im Forum Fragen zur Anwendung von JanBob	5	06.01.2021 09:03 von JanBob • Zugriffe: 400
Suche Mikrofon passend für iMac Erstellt im Forum Geräte und Hardware von glombi	0	09.12.2020 13:57 von glombi • Zugriffe: 355

Sprung

Anwenderforum für die Dragon-Spracherkennung

Bitte geben Sie einen Grund für die Verwarnung an