Sie sind vermutlich noch nicht im Forum angemeldet - Klicken Sie hier um sich kostenlos anzumelden Impressum 
Sie können sich hier anmelden
Dieses Thema hat 8 Antworten
und wurde 20 mal aufgerufen
 Fragen zur Anwendung
R.Wilke Offline



Beiträge: 6.118

21.10.2010 23:11
RE: Das doppelte akustische Modell, die "Trennschärfe" und die T-Wellen Zitat · Antworten

Anlässlich der Beiträge von Eberhard Foerster zu seinen bisherigen negativen Erfahrungen mit dem Umstieg auf die Version 11 nach Import des bestehenden Benutzerprofils (siehe http://dragon-spracherkennung.forumprofi...776.html#p1776) habe ich einmal ein Experiment mit den Wörtern "T-Welle" und "T-Wellen" unternommen, indem ich diese einmal in meinem relativ untrainierten Benutzerprofil der Version 11 (BestMatch IV) und im Vergleich dazu in einem Profil der Version 10 (BestMatch III) aufgenommen gegeneinander getestet habe.

Das Ergebnis sieht wie folgt aus:

Zunächst ist festzustellen, dass bei Aufnahme dieser Wortformen als geschriebener Form die Version 11 darauf aufmerksam macht, dass zur besseren Erkennung eine gesprochene Form als Beigabe zu empfehlen ist, dies im Unterschied zu Version 10, wo dieser Hinweis nicht erfolgt, obwohl er nötig wäre, da sie ansonsten nicht so ohne weiteres erkannt würde.

Also habe ich in beiden Versionen eine gesprochene Form beigefügt, in Version 10 in der Form "T. Welle", in Version 11 demgegenüber "T Welle", da gesprochene Formen in der Version 11 keine Satzzeichen oder Sonderzeichen mehr akzeptieren.

Dasselbe habe ich jeweils mit den Pluralformen dieser Wörter durchgeführt. Anschließend habe ich die beiden Wörter jeweils ohne vorhergehendes Training mehrfach nacheinander in unterschiedlicher Reihenfolge und auch im Satzzusammenhang beliebig wechselnd diktiert, dies sowohl in Version 11 als auch in Version 10.

Das Ergebnis war relativ ernüchternd zumindest für diejenigen, die nach wie vor der Meinung sind, dass hinsichtlich der Effizienz dieser beiden Versionen kein Unterschied besteht oder gar wegen teilweiser auftretender, meines Erachtens jedoch individuell bedingter Probleme mit der Version 11 der Rückschritt zur Version 10 zu empfehlen sei.

Eine genaue Zählung habe ich nicht durchgeführt, aber schätzungsweise habe ich die Wörter jeweils 20 mal in beiden Versionen in der oben beschriebenen Weise diktiert. Die Grundform an sich wurde relativ problemlos erkannt, aber eine exakte bzw. zuverlässige Unterscheidung des Singulars und des Plurals war bei der Version 11 nahezu durchgängig festzustellen, eine einzige Ausnahme abgesehen, demgegenüber in der Version 10 etwa nur zur Hälfte zu erreichen.

Dies deckt sich mit den Berichten insbesondere der deutschen Anwender, dass in der neuen Version die Wortendungen wesentlich besser und zuverlässiger erkannt werden als noch in der Version 10 – meiner Meinung nach sind die Wortendungen in Version 10 Glückssache, schätzungsweise fifty-fifty –, und lässt sich letztendlich nur durch die Schlagwörter im Titel, insbesondere mit dem von Marius Raabe geprägten Begriff "Trennschärfe", erzielt durch das grundlegend verbesserte akustische Modell, hinreichend erklären.

Anwendern, die vor einem ähnlichen Problem wie Herr Förster stehen, dass ihre Wortlisten möglicherweise viele solcher zusammengesetzter Wortformen enthalten, gegebenenfalls zusätzlich noch ohne entsprechende gesprochene Formen zur leichteren Erkennung, soll dies als Hinweis dienen, sich mit diesem Problem zu befassen.

Zu erwägen wären programmatische Mittel, wie mit solchen Datensätzen verfahren werden kann, um sie für die neue Version tauglich zu machen.

Rüdiger Wilke

_______________________________________

DPG 15.6 (15.60.200.015) auf Windows 10 Pro (64-bit)
SpeechMike Premium (LFH3500) + SpeechMike II
HP ZBook 17 G2 (Refurbished) - i7-4910qm - 8MB SmartCache - 32 GB RAM - 512 GB SSD - 1 TB HSSD - 2 TB HDD

Marius Raabe Offline



Beiträge: 718

22.10.2010 07:50
#2 RE: Das doppelte akustische Modell, die "Trennschärfe" und die T-Wellen Zitat · Antworten

Rüdiger,

ich habe keine Version 10 mehr zur Verfügung. In der Version 11 habe ich die beiden gesprochenen Formen eingegeben, ohne jedes Training wurden die neuen Wörter im Singular und Plural fehlerfrei erkannt, lediglich hinsichtlich der flektierten Formen dazugehöriger Adjektive/Attribute (oder wie hieß das noch, im Gegensatz zu dir habe ich nicht Germanistik studiert, da hier folgende Beispiele: bei den einzelnen T-Wellen, einzelne T-Welle, einzelne T-Wellen) musste ich einmal korrigieren, das war's.

Bildlich gesprochen, ist meiner Meinung nach Dragon 11 der Porsche 911 unter den Spracherkennungen (bzw. den Versionen von Dragon): Man braucht ein bisschen Übung beim Einkuppeln und viel Gefühl am Gaspedal, dann aber geht's richtig ab und man lässt sowohl an der Ampel wie auf der Autobahn alle anderen ziemlich alt aussehen.

Dragon NaturallySpeaking 11.5 Legal
Windows 7 Prof. 64-Bit, Office 2010, Jarte Plus
Philips SpeechMike II Pro Plus, SpeechMike III, SpeechMike Air, PDCC 2.8
Intel Core2 Quad Q9550, 2,83 GHz, 2x6MB L-2, 8 GB RAM

R.Wilke Offline



Beiträge: 6.118

22.10.2010 08:08
#3 RE: Das doppelte akustische Modell, die "Trennschärfe" und die T-Wellen Zitat · Antworten

Hallo Marius, das Bild mit dem Porsche 911 gefällt mir sehr gut, und um es fortzusetzen, sollte man vielleicht auch auf Anbauten aus dem Zubehör verzichten und nicht selbst anfangen zu schrauben, um ihn noch besser zu machen, und wenn er dann nicht mehr läuft, den Entwicklern die Schuld zuweisen.

Rüdiger

_______________________________________

DPG 15.6 (15.60.200.015) auf Windows 10 Pro (64-bit)
SpeechMike Premium (LFH3500) + SpeechMike II
HP ZBook 17 G2 (Refurbished) - i7-4910qm - 8MB SmartCache - 32 GB RAM - 512 GB SSD - 1 TB HSSD - 2 TB HDD

Marius Raabe Offline



Beiträge: 718

22.10.2010 08:28
#4 RE: Das doppelte akustische Modell, die "Trennschärfe" und die T-Wellen Zitat · Antworten

Genau, im Gegenteil sollte man eher das Überflüssige weglassen: Ich habe mal von einem Kollegen gehört, der hat bei seinem Sportflitzer die Rückbank ( ) ausgebaut, um schneller in die Gänge zu kommen. Übersetzt:
1. Die Dragon-Randleiste sollte man abschalten, die verbraucht nur unnötig Ressourcen.
2. Viele gleichzeitig geöffnete Word-Fenster und Internet Explorer-Fenster sind wie ein Stau auf der Drachen-Autobahn, da steht man dann auch gerne mal mit dem 911er hinter dem Fiat 500.
Aber das führt jetzt vom Thema weg…, Gruß, Marius

Dragon NaturallySpeaking 11.5 Legal
Windows 7 Prof. 64-Bit, Office 2010, Jarte Plus
Philips SpeechMike II Pro Plus, SpeechMike III, SpeechMike Air, PDCC 2.8
Intel Core2 Quad Q9550, 2,83 GHz, 2x6MB L-2, 8 GB RAM

R.Wilke Offline



Beiträge: 6.118

22.10.2010 08:35
#5 RE: Das doppelte akustische Modell, die "Trennschärfe" und die T-Wellen Zitat · Antworten

Du meinst, dass die Porsche-Ingenieure wohl doch ein bisschen schlauer sind als die meisten Fahrer? - Auto fahren und Fußball gucken, immer das selbe, lauter Experten unterwegs.

Rüdiger

_______________________________________

DPG 15.6 (15.60.200.015) auf Windows 10 Pro (64-bit)
SpeechMike Premium (LFH3500) + SpeechMike II
HP ZBook 17 G2 (Refurbished) - i7-4910qm - 8MB SmartCache - 32 GB RAM - 512 GB SSD - 1 TB HSSD - 2 TB HDD

Eberhard Foerster Offline



Beiträge: 5

26.10.2010 21:35
#6 RE: Das doppelte akustische Modell, die "Trennschärfe" und die T-Wellen Zitat · Antworten

Lieber Herr Wilke,

Ich habe mich in der Zwischenzeit noch einmal ausführlich mit den Versionen DNS 10 und DNS 11 beschäftigt. Aus meiner Sicht ist die Genauigkeit im direkten Diktat von Dragon 11 sicher kaum zu übertreffen. Bezüglich der Geschwindigkeit, in der Diktatdateien übertragen werden ergibt sich sicher ein differenzierteres Bild. In diesem Zusammenhang habe ich noch einmal 3 verschiedene Benutzerprofile aufgebaut

1.ganz neues Profil ohne Training

2.ganz neues Profil, jedoch mit Import des Vokabulars aus meiner mediz. Textsammlung, getreu nach dem Erkennungscenter „von bestimmten Dokumenten lernen“. Dabei wurden 40.000 Wörter/Wortformen importiert.

3.Profil aus DNS10 exportiert, wie vorgeschrieben, importiert, und Geschwindigkeitsoptimierung durchgeführt.

Am schnellsten und am genauesten ist das dritte Profil, wobei bei allen 3 Profilen für meinem anonymisierten Probetext (3 min.25 sek. lang, im Anhang) jeweils in Reglerstellung „schnell“ etwa 40 – 45 sek. gebraucht wurden. Die Qualität ist dabei für meinen Bedarf ausreichend, mit nur noch minimalem Korrekturbedarf.
Ohne Profilimport (wie in Version 2) ist bei dem umfangreichen Vokabular (selbst wenn dort die Hälfte aus falsch geschriebenen Wörtern oder seltenen Eigennamen bestehen sollte, ein Ergebnis wie in 3 nicht ohne massiven Aufwand zu erzielen.
Der Rechner: Acer 5741G, Intel Core i5-430M,2,26 GHz, 4 GB DDR3 Memory. Außer Dragon und Virenscanner läuft nichts parallel.

Mein alter Rechner Intel DuoCore 2 CPU 6400, 2,14 GHz, 2 GB RAM, benötigt in Position schnell etwa 30 sek., in Position genau etwa 60 sek. DieErkennungsgenauigkeit ist mt Reglerstellung schnell deutlich schlechter als bei DNS11 , in Stellung genau etwa gleich wie bei DNS 11.

R.Wilke Offline



Beiträge: 6.118

26.10.2010 21:57
#7 RE: Das doppelte akustische Modell, die "Trennschärfe" und die T-Wellen Zitat · Antworten

Hallo Herr Förster,

ist der Probetext, mit dem Sie die Tests durchgeführt haben, auch in der Sammlung enthalten, die Sie für die Profilanpassung verwendet haben? - Wenn ja, wird dadurch das Ergebnis verfälscht.

Mein Vorschlag: Diktieren Sie noch mal einen neuen Text, nicht unbedingt sehr spezifisch, da sonst Profil 1 gar keine Chance hätte, und testen Sie noch mal mit allen drei Profilen, aber mit dem Regler immer in der mittleren Stellung.

Außerdem werde ich Ihnen noch ein von mir entwickeltes Testprogramm zusenden, und ich würde Sie bitten, dort hinein einige Sätze zu diktieren, so etwa 4 oder 5, die ich Ihnen aufschreiben werde, auch jeweils mit allen drei Profilen. Aus dem Programm heraus können Sie die Testergebnisse in einer Log-Datei abspeichern, und ich würde Sie bitten, mir die Daten zuzusenden, damit ich mir sie ansehen kann.

Danke für die Mitteilungen.

Grüße
Rüdiger Wilke

_______________________________________

DPG 15.6 (15.60.200.015) auf Windows 10 Pro (64-bit)
SpeechMike Premium (LFH3500) + SpeechMike II
HP ZBook 17 G2 (Refurbished) - i7-4910qm - 8MB SmartCache - 32 GB RAM - 512 GB SSD - 1 TB HSSD - 2 TB HDD

Eberhard Foerster Offline



Beiträge: 5

26.10.2010 22:51
#8 RE: Das doppelte akustische Modell, die "Trennschärfe" und die T-Wellen Zitat · Antworten

Der Diktierte Text ist erst 4 Tage alt! In meinem Profil liegt hingegen ein Ordner mit 20.000 Dateien zugrunde. Es wurde vor etwa 3 Wochen importiert!

Mit freundlichen Grüßen,

E.- Förster

R.Wilke Offline



Beiträge: 6.118

26.10.2010 22:56
#9 RE: Das doppelte akustische Modell, die "Trennschärfe" und die T-Wellen Zitat · Antworten

Achten Sie bitte auf Ihren Mail-Eingang. Wenn Sie wollen, können wir die Performance (zumindest) ganz genau bestimmen.

Grüße
Rüdiger Wilke

_______________________________________

DPG 15.6 (15.60.200.015) auf Windows 10 Pro (64-bit)
SpeechMike Premium (LFH3500) + SpeechMike II
HP ZBook 17 G2 (Refurbished) - i7-4910qm - 8MB SmartCache - 32 GB RAM - 512 GB SSD - 1 TB HSSD - 2 TB HDD

Ähnliche Themen Antworten/Neu Letzter Beitrag⁄Zugriffe
Das Doppelte nachdenken
Erstellt im Forum Fragen zur Anwendung von
2 24.10.2018 16:11
von Dioskur • Zugriffe: 35
Akustische Optimierung wird nicht beendet
Erstellt im Forum Fragen zur Anwendung von
6 12.10.2016 19:16
von Mohnblumenmädchen • Zugriffe: 36
Dragon individuell 15, doppelte Buchstaben am Anfang
Erstellt im Forum Fragen zur Anwendung von
8 15.10.2016 02:15
von c.bayerlein • Zugriffe: 33
Optimierung akustisches Modell
Erstellt im Forum Fragen zur Anwendung von
6 03.08.2015 18:32
von thalon • Zugriffe: 40
Akustisches Archiv lässt sich nicht vergrößern
Erstellt im Forum Fehlermeldungen von
9 14.02.2014 08:05
von 1ARecht • Zugriffe: 48
Optimierung der Modelle
Erstellt im Forum Fragen zur Anwendung von
1 18.10.2010 18:11
von R.Wilke • Zugriffe: 34
zu Schritt 9 - Optimierung der Modelle
Erstellt im Forum Fragen zur Anwendung von
3 03.05.2010 10:43
von R.Wilke • Zugriffe: 52
9. Schritt: Optimierung der Modelle
Erstellt im Forum Wie mache ich das: von
0 23.04.2010 18:36
von R.Wilke • Zugriffe: 99
Glossar (in Bearbeitung)
Erstellt im Forum FAQ & Troubleshoot: von
0 06.03.2010 01:20
von R.Wilke • Zugriffe: 89
 Sprung  
Xobor Ein Kostenloses Forum | Einfach ein Forum erstellen
Datenschutz