Fragen zur Anwendung » Vokabulargröße und Performance

Sie können sich hier anmelden

Dieses Thema hat 16 Antworten
und wurde 296 mal aufgerufen

Fragen zur Anwendung

Seiten 1 | 2

RE: Vokabulargröße und Performance

Zitat · Antworten

Zitat von R.Wilke
Man kann prinzipiell bis zu 150.000 Wörter hinzufügen, und, wenn man es richtig macht, ohne Einschränkung für die Leistungsfähigkeit des Drachen, demgegenüber schon eher die Erinnerungsfähigkeit des Anwenders überlasten.

Also spricht nichts dagegen, das alles mit einem Vokabular zu lösen, sofern angebracht.

Gruß, Rüdiger

Die Größe des Vokabulars hat meiner Erfahrung nach in der Tat keinen Einfluss auf die Performance.
Ich habe allerdings eine andere Beobachtung gemacht, weshalb ich mir ein neues Profil mit dem alten Vokabular angelegt habe.
Ich habe mein Profil über Jahre beginnend bei Dragon 9 bis heute fortgeschrieben, und die current-Datei war mittlerweile auf 1,1 GB angewachsen, das gesamte Profil mit Backup auf 2,3 GB. Das hat natürlich die Ladezeit verlangsamt, das größere Problem war aber, dass die Genauigkeitsoptimierung dann schon gut 4 h dauerte mit steigender Tendenz, und ich mich schon immer fragte, habe aber nirgends etwas darüber gefunden, warum Dragon nicht eine Routine einbaut, die das unbegrenzte Wachsen der Sprachdateien limitiert.
Ich habe dann ein neues Profil angelegt und mein eigenes Vokabular (etwa 20.000 Wörter) wieder importiert, jetzt ist die current-Datei nur knapp 0,3 GB, das gesamte Profil 0,7 GB und die Genauigkeitsoptimierung dauert gerade einmal 20 min, auch die Ladezeit ist vernachlässigbar.
Wenn aber die Performance von Dragon und die Größe der Sprachdatei vom eigenen Vokabular maßgeblich beeinflusst werden würde, hätte mein neues Profil mit den „alten“ eigenen Wörtern sich in der Größe von ursprünglichen Profil nicht wesentlich unterscheiden dürfen - nehme ich einmal an.
Das unbegrenzte Anwachsen meines Profils erkläre ich mir damit, dass Dragon die Kontextsensitivität ausgebaut hat, und damit mit jeder neuen Generation der Software die Listen mit vorhergehenden und nachfolgenden Wörtern inklusive der statistischen Wahrscheinlichkeiten stärker vernetzt werden und damit anwachsen. Und diese Listen der wahrscheinlichsten Wortfolgen werden nicht gelöscht, sondern immer nur erweitert, was das permanente Anwachsen des Profils erklären würde. (?)

DNS 15.3 Professional Individual auf Windows 10 Home (64-bit)
Plantronics PLT Savi W440
Intel (R) Core (TM) i7-7500 2,7 GHz 8 GB RAM 64 Bit

#2 RE: Vokabulargröße und Performance

Zitat · Antworten

Hallo Harald,

interessanter Beitrag, der viele Fragen aufwirft. Allerdings, und zu Beginn, bei der Größe des Profils (an Speicherplatz) spielt das Vokabular eine untergeordnete Rolle. Die Vokabular-Dateien liegen im Ordner namens "Allgemein" (wenn man das Allgemeine Vokabular verwendet). In der deutschen Version ist dieser Ordner zu Beginn ca. 30 MB groß. Da ich zufällig ein Profil vor mir habe, wozu daneben noch ein zweites Vokabular existiert (in der Pro-Version geht das ja), welches demgegenüber weitere ca. 30.000 Wörter umfasst, also zusammen rund 180.000 Wörter, habe ich die Größe dieses Ordners mal damit verglichen: er ist nur ca. 5 MB größer als am Anfang.

Mit anderen Worten, die Vokabular-Daten tragen nicht dazu bei, dass Profile beachtlich anwachsen können, da sind andere Dinge im Spiel (akustisches Archiv und DRA-Dateien).

Letztgenannte wiederum spielen keine Rolle beim Laden des Profils, wohlgemerkt jedoch bei der Optimierung, die umso länger dauert, je größer das akustische Archiv (über die Zeit) angewachsen ist.

Beim Laden des Profils aber spielt die Größe des Vokabulars eine Rolle, da das komplette aktive Lexikon in den Arbeitsspeicher geladen wird. In der Log-Datei kann man das nachvollziehen (nach "voc load time" und in der Umgebung suchen).

Hinsichtlich der Größe des Profils würde ich mir aber keine Gedanken machen, das regelt Dragon im Laufe der Zeit von selbst.

Gruß, Rüdiger Wilke

_______________________________________

Dragon Professional 16 auf Windows 10 Pro und Windows 11
SpeechMike Premium (LFH3500); Office 2019 Pro + Office 365 (monatliches Abo)
HP ZBook Fury 17 G8 - i7-11800H - 24 MB SmartCache - 32 GB RAM - 1 TB SSD

#3 RE: Vokabulargröße und Performance

Zitat · Antworten

Zitat von R.Wilke
Hinsichtlich der Größe des Profils würde ich mir aber keine Gedanken machen, das regelt Dragon im Laufe der Zeit von selbst.

Allerdings - die Frage ist nur wie!
Die Benutzerdateien meines Standard-Benutzer Profils, die ich seit Erscheinen der Version 11 im September 2010 im Gebrauch habe – neu angelegter Benutzer –, belegen mittlerweile etwa 3 GB.

Zwar werden bei der Genauigkeitsoptimierung die Archivdateien sozusagen konsolidiert – nach meiner Beobachtung hindert das aber nicht ein allmähliches Anwachsen der Größe der Benutzerdateien. Wer das nicht will, muss halt die gelegentliche Nachfrage des Programms, ob man die Größe des akustischen Archivs erhöhen möchte, einmal mit „Nein“ beantworten – dann ist Schluss, aber es werden eben auch keine Einträge mehr im Archiv gesammelt (glaube ich).

Nachdem ich mir wegen der Größe der Profildateien früher auch immer mal Sorgen gemacht habe:

http://dragon-spracherkennung.forumprofi...fil-v11-ok.html,

bin ich insoweit mittlerweile (wie Rüdiger) etwas fatalistisch und mäste meinen Drachen fleißig, mit anderen Worten, ich beantworte die Frage nach der Vergrößerung des akustischen Archivs regelmäßig mit „Ja“.

Irgendwann erscheint ja eine neue Drachen-Version und dann ist es jedes Mal Zeit, ein neues Benutzerprofil anzulegen - denn ein Upgrade des Benutzerprofils insgesamt wird von den Auguren standardmäßig (entgegen den Hersteller-Angaben) für risikoreich und suboptimal erachtet (Import des Vokabulars / einer Liste benutzerdefinierter Wörter ist die bessere Lösung). Danach geht die Drachen-Mast von vorn los.

Bestens, Marius Raabe

Dragon NaturallySpeaking 11.5 Legal
Windows 7 Prof. 64-Bit, Office 2010, Jarte Plus
Philips SpeechMike II Pro Plus, SpeechMike III, SpeechMike Air, PDCC 2.8
Intel Core2 Quad Q9550, 2,83 GHz, 2x6MB L-2, 8 GB RAM

#4 RE: Vokabulargröße und Performance

Zitat · Antworten

Zitat von Marius Raabe
Allerdings - die Frage ist nur wie!
Die Benutzerdateien meines Standard-Benutzer Profils, die ich seit Erscheinen der Version 11 im September 2010 im Gebrauch habe – neu angelegter Benutzer –, belegen mittlerweile etwa 3 GB.

Du diktierst eben zu viel! - Spaß beiseite. Offen gesagt, kann ich die immer mal wieder vorgebrachten Bedenken hinsichtlich der Datengröße des Benutzerprofils nicht ganz nachvollziehen, jedenfalls musste ich mir deshalb noch nie eine größere Festplatte anschaffen.

Aber im einzelnen dazu. Man darf nicht außer Acht lassen, dass seit Version zwei Faktoren hinzugekommen sind, die diesen Effekt zusätzlich verstärken, nämlich dass (1) mit der Verdoppelung der Abtastrate sämtliche Daten, die Audioinformationen enthalten, den doppelten Datenumfang benötigen (hier denke man insbesondere an die DRA-Dateien, aber auch an alle Dateien mit der Endung .nwv (Nist Wave), wozu ebenso das wachstumsträchtige akustische Archiv gehört, und dass (2) zusätzliche Sicherungsordner geschaffen worden sind, die im Ordner "chkpt" (für "checkpoint") Kopien des Profils (zumindest von Teilen davon nach meiner Beobachtung) im Zusammenhang mit der Durchführung der Optimierungen verwalten. - Was für ein Bandwurmsatz...

Jedenfalls aber, und darauf bezog sich meine Aussage, dass Dragon das über die Zeit von selbst regelt, werden sowohl die DRA- und NWV-Dateien nicht nur angelegt, sondern auch in periodischen Abständen nach einem bestimmten Muster wieder gelöscht, wäre das nicht der Fall, wäre Dein Profil vermutlich schon zwei- oder dreimal so groß.

Mas kann es sehen, wie man will, ich jedenfalls sehe es so, dass ich mir darüber keine Gedanken mache, die Einstellungen weitgehend so belasse, wie sie sind, vor allem nicht die Optionen deaktiviere, dass Korrekturen im Archiv gespeichert werden, oder der Umfang der Benutzerdateien begrenzt werden soll (dann bräuchte ich auch erst gar nicht zu korrigieren) - sondern lass den Drachen das mal so machen, wie er dafür eingerichtet ist.

Gruß, Rüdiger

#5 RE: Vokabulargröße und Performance

Zitat · Antworten

Zitat von R.Wilke
Offen gesagt, kann ich die immer mal wieder vorgebrachten Bedenken hinsichtlich der Datengröße des Benutzerprofils nicht ganz nachvollziehen, jedenfalls musste ich mir deshalb noch nie eine größere Festplatte anschaffen.

Der einzige Gedanke, der mich veranlasst hatte, ein neues Profil anzulegen, das nicht mehr so groß war, ist die lange Ladezeit (in Wahrheit sind es natürlich nur Sekunden, aber wenn man wartet und ungeduldig ist, können die sich auch ziehen ) und die Stunden, die der PC für die Genauigkeitsoptimierung brauchte, und insoweit hatte für mich ein neues kleineres Profil durchaus Vorteile. Was vor allem aber eine interessante Erfahrung war, dass nach dem Import des eigenen Vokabulars das neue Profil gegenüber dem über Jahre gewachsenen in der Erkennungsgenauigkeit durchaus keine schlechtere Performance zeigte. Dies könnte man wohl als Indiz dafür werten, dass die Kontextsensitivität nicht sehr ausgeprägt zu sein scheint.

In dem Zusammenhang wäre sicher interessant, einmal zu wissen, welche Algorithmen im Hintergrund ablaufen. Zum Beispiel, wenn ich über Azubis rede, ist dann Dragon in der Lage Leere und Lehre auseinander zu halten? (an dieser Stelle scheinbar schon) Also ein Azubi befindet sich in der Lehre, das wird noch erkannt, aber wenn ich ein Glas Wein Lehre, ist Dragon bereits am Limit und versagt, wie man vorstehend erkennen kann. Damit gibt es aus meiner Sicht bei der Kontextsensitivität noch ein erhebliches Potenzial der Verbesserung.

DNS 15.3 Professional Individual auf Windows 10 Home (64-bit)
Plantronics PLT Savi W440
Intel (R) Core (TM) i7-7500 2,7 GHz 8 GB RAM 64 Bit

#6 RE: Vokabulargröße und Performance

Zitat · Antworten

Zitat von R.Wilke
Mas kann es sehen, wie man will, ich jedenfalls sehe es so, dass ich mir darüber keine Gedanken mache, die Einstellungen weitgehend so belasse, wie sie sind, vor allem nicht die Optionen deaktiviere, dass Korrekturen im Archiv gespeichert werden, oder der Umfang der Benutzerdateien begrenzt werden soll (dann bräuchte ich auch erst gar nicht zu korrigieren) - sondern lass den Drachen das mal so machen, wie er dafür eingerichtet ist.

R.R. = Richtig, Rüdiger - das war auch die Quintessenz, die ich herüber bringen wollte. Andererseits kann man es den Benutzern nicht verübeln, dass sie angesichts der gigantischen Datenmengen befürchten, dass irgendetwas falsch läuft, zumal Dragon bedauerlicherweise – wenn auch angesichts der Komplexität nicht verwunderlicherweise – durchaus bei dem einen oder anderen Benutzer Fehler an den Tag legt. Da gerät man vielleicht ins Grübeln, ob irgendetwas suboptimal läuft, auch wenn der Drache ja mit den großen Benutzerdateien funktioniert.
Daher gibt es ein verständliches Interesse, bei anderen in Erfahrung zu bringen, ob die Größe der Dateien so etwa einer Norm entspricht – die es für den Fall aber eben schwerlich gibt, weil in der Tat abhängig von Häufigkeit und Intensität der Benutzung sowie dem Erfolg der Genauigkeitsoptimierung.
Die Menschen – ich eingeschlossen – tun sich nun einmal schwer mit der Unterdeterminiertheit sehr komplexer und statistisch gesteuerter Prozesse.

N.N.

#7 RE: Vokabulargröße und Performance

Zitat · Antworten

Zitat von Harald
Was vor allem aber eine interessante Erfahrung war, dass nach dem Import des eigenen Vokabulars das neue Profil gegenüber dem über Jahre gewachsenen in der Erkennungsgenauigkeit durchaus keine schlechtere Performance zeigte. Dies könnte man wohl als Indiz dafür werten, dass die Kontextsensitivität nicht sehr ausgeprägt zu sein scheint.

Das wäre nach meiner Vermutung ein Trugschluss. Es ist im Gegenteil ein Indiz dafür, dass die Kontextsensitivität, verstanden in dem Sinne der Steuerung durch das Sprachmodell, ausgeprägt ist (Dragon verwendet immerhin Quadgramme) und das Standard-Sprachmodell des Drachen in der Version 11 sehr ausgereift ist. Ich würde nämlich denken, dass gerade die Gewöhnung an die akustischen Eigenheiten des Sprechers, also die Verfeinerung des akustischen Modells, mehr Training und Optimierungs-Zyklen in Anspruch nehmen würde, eine relativ starke Abhängigkeit vom statistischen Zusammenhang der Wörter (Sprachmodell) kann das gut kompensieren. Freilich lassen sich in der Praxis die beiden Elemente für den Benutzer nicht wirklich auseinanderhalten. Insgesamt hat sich der Hersteller nun einmal bei der Version 11 besondere Mühe gegeben, die so genannte out-of-the-box-Genauigkeit zu verbessern, natürlich im Interesse nicht nur der Benutzer, sondern auch des Marketing. Auf der akustischen Seite ist da die von Rüdiger Wilke schon hervorgehobene Verdoppelung der Abtastrate zu nennen.

Was schließlich die Ladezeit angeht: Wenn man den Drachen nur einmal am Tag beim Start des Computers aktiviert, scheint mir diese im Verhältnis zur Windows-Startzeit kaum ins Gewicht zu fallen. Wenn man freilich häufiger das Benutzerprofil wechselt, z.B. zwischen verschiedenen Sprachen, was ohnehin ein Thema für sich ist, gebe ich Ihnen recht, da können zusätzliche Sekunden schon nerven.

Zu den grundsätzlichen Funktionsweisen und auch zu den Problemfällen gab es hier im Forum schon lebendige Diskussionen:

http://dragon-spracherkennung.forumprofi...-grammatik.html

http://dragon-spracherkennung.forumprofi...ngsskripts.html

http://dragon-spracherkennung.forumprofi...-erkennung.html

http://dragon-spracherkennung.forumprofi...sonderfall.html

Bestens, Marius Raabe

#8 RE: Vokabulargröße und Performance

Zitat · Antworten

Zitat von Harald
... Dies könnte man wohl als Indiz dafür werten, dass die Kontextsensitivität nicht sehr ausgeprägt zu sein scheint.

... Zum Beispiel, wenn ich über Azubis rede, ist dann Dragon in der Lage Leere und Lehre auseinander zu halten? (an dieser Stelle scheinbar schon) Also ein Azubi befindet sich in der Lehre, das wird noch erkannt, aber wenn ich ein Glas Wein Lehre, ist Dragon bereits am Limit und versagt, wie man vorstehend erkennen kann. Damit gibt es aus meiner Sicht bei der Kontextsensitivität noch ein erhebliches Potenzial der Verbesserung.

Man sollte, meine ich, etwas vorsichtiger umgehen mit Wertungen wie "erhebliches Potential", wie man am vorliegenden Beispiel zeigen kann. Oder könnte? - folgende Tests konnte ich mit demselben Ergebnis auch wiederholen:

1) Zweimal den Satz "Also ein Azubi ... und versagt." diktiert brachte immer den Fehler "..Wein Lehre...". Das Wort "Lehre" habe ich in beiden Fällen PER HAND mit "leere" überschrieben. Nochmalige Diktate des Beispielsatzes, und Dragon schreibt immer richtig. Hat also was gelernt.

2) Wenn ich (nach Dragon-Neustart, ohne Speicherung der Benutzerdaten) den richtig geschriebenen Beispielsatz in DragonPad kopiere (oder tippe) und anschließend noch einmal diktiere, schreibt Dragon gleich richtig.

Soviel zur Kontextsensivität. Nebeneffekt: Dragon lernt also gelegentlich (?) auch durch Übertippen (wie in der Werbung zu Version 11 behauptet), natürlich lernt Dragon dadurch keine neuen Wörter. Aber das ist ein anderes Thema und in den verschiedenen Foren auch schon diskutiert.

Grüße
Pascal

#9 RE: Vokabulargröße und Performance

Zitat · Antworten

Zitat von Harald
In dem Zusammenhang wäre sicher interessant, einmal zu wissen, welche Algorithmen im Hintergrund ablaufen. Zum Beispiel, wenn ich über Azubis rede, ist dann Dragon in der Lage Leere und Lehre auseinander zu halten? (an dieser Stelle scheinbar schon) Also ein Azubi befindet sich in der Lehre, das wird noch erkannt, aber wenn ich ein Glas Wein Lehre, ist Dragon bereits am Limit und versagt, wie man vorstehend erkennen kann. Damit gibt es aus meiner Sicht bei der Kontextsensitivität noch ein erhebliches Potenzial der Verbesserung.

Eine wirklich sehr interessante Frage und ein sehr großes Thema, was Sie da anschneiden. Glücklicherweise aber stellen Sie die Frage an genau dem richtigen Ort. Nicht zuletzt auch ein ausgesprochen interessantes Beispiel, mit dem ich mich einmal befasst habe und woran man so einiges verdeutlichen kann, allerdings dauert es etwas und ich bitte jetzt schon um Geduld.

Grob gesagt geht es bei dem Sprachmodell darum, mögliche Mehrdeutigkeiten ähnlich oder identisch klingender Wörter oder Ausdrücke (Homophonie) aufzulösen, zu welchem Zweck es eingeschaltet wird, und je nachdem, wie hart sich die Konkurrenz gestaltet, umso länger sucht, in Abhängigkeit von der Stellung des Reglers "Schnelligkeit versus Genauigkeit". Am besten aber ist das immer an einem Beispiel zu verdeutlichen, also betrachten wir einmal den Fall "Lehre versus leere".

Fangen wir dazu einmal ganz hinten an. Grammatisch betrachtet, sind die folgenden fünf Fälle zu unterscheiden:

1
2
3
4
5
 
Lehre: Nominativ Singular eines Substantivs
lehre: 1. Person Singular Pr&auml;sens eines Verbs
Leere: Nominativ Singular eines Substantivs
leere: 1. Person Singular Pr&auml;sens eines Verbs
leere: diverse Adjektiv-Formen
 

Würde man noch die Semantik hinzunehmen, müsste man betrachten, dass das Wort "Lehre" noch zwei sehr unterschiedliche Bedeutungen hat, wenngleich miteinander verwandt, aber es ist halt ein typischer Fall von so genannter Poli-Semantik. (Das wurde in der guten alten Zeit auch noch anders geschrieben.)

Bei der Spracherkennung aber in der jetzigen Form zumindest und unter dem Gesichtspunkt ihrer Funktion als Umsetzung gesprochener Rede in geschriebenen Text spielen weder Grammatik noch Semantik irgendeine Rolle! Warum erwähne ich das denn? Nun, weil wir sehr oft vor dem Bildschirm sitzen und uns fragen, warum er uns eigentlich nicht versteht. – Menschlich, allzu menschlich.

Für das Gelingen von Spracherkennung ist nach unserem Ermessen entscheidend, dass das, was wir diktieren, in den von uns erwarteten geschriebenen Formen, wie sie im Vokabular aufgelistet sind, umgesetzt wird. Aber genau darin liegt wiederum bei diesem Beispiel eben die Crux. Denn auch unter diesem Gesichtspunkt haben wir vier verschiedene Fälle zu betrachten, nämlich:

1
2
3
4
 
Lehre
lehre
Leere
leere
 

Genau genommen aber sind es noch mehr, nämlich wenn wir uns diese Wörter einmal im Vokabular-Editor anschauen, werden wir feststellen, dass die Wörter mehrmals auftauchen, die Wortform "lehre" etwa ist zweimal untereinander gelistet, das hängt damit zusammen, dass sie als Bestandteil eines Kompositums vorgesehen ist, wie man mit einem unter anderem dazu eingerichteten Spezial-Editor sehen kann (in der dritten Spalte von links):

Das gleiche gilt übrigens auch für das Adjektiv "leer". Anders betrachtet, sind wir somit also noch keinen Schritt weiter gekommen wenn es darum geht, Identifikationskriterien zu finden, die dazu dienen könnten, mögliche Mehrdeutigkeiten beim Diktat dieser Wörter aufzulösen.

Allerdings, sind die bisherigen Überlegungen alle nur rückwärts gerichtet, von vorne betrachtet sieht es wieder ganz anders aus. Die Spracherkennung nämlich greift primär nicht auf die geschriebenen Formen zu, sondern auf die gesprochenen Formen bzw. auf die den Wörtern zu Grunde liegenden Aussprachen, die uns nicht unmittelbar zugänglich sind. In dem Moment aber, wo eine Aussprache bzw. gesprochene Form eindeutig identifiziert ist, wird die damit verknüpfte geschriebene Form aufgegriffen und als Text umgesetzt. Und nur der Vollständigkeit halber, falls jemand es nicht glaubt, möchte ich noch demonstrieren, dass all die oben beschriebenen Wortformen über ein und dieselbe Aussprache verfügen:

Nur zur Erläuterung, jedes Wort im Vokabular muss mindestens über eine Aussprache verfügen, in vielen Fällen jedoch sind zwei oder mehr Aussprachen vorhanden. Mit anderen Worten, Dragon verfügt über eine Tabelle mit mehr als 150.000 verschiedenen Aussprachen für Wörter und Ausdrücke, gemäß dem aktiven Wortschatz, aus denen heraus diejenigen ausgesucht werden, die in der betreffenden Äußerung identifiziert werden. Sofern diese Identifikation eindeutig ist, bestehen keine Probleme und es wird stets die erwartete geschriebene Form verwendet und als Text umgesetzt. Im vorliegenden Beispiel aber kann nun jeder nachvollziehen, welche vielfältigen Verwechselungen darin begraben liegen.

Wie aber dann ist es überhaupt möglich, dass Dragon bei zugegebenermaßen immer wieder auftretenden und zum Teil gravierenden Überschneidungen auch annähernd brauchbare Ergebnisse liefern kann? Zu Demonstrationszwecken habe ich einmal die beiden hier diskutierten Wortformen verwendet und im folgenden Beispielsatz - einer lebensnahen Situation entnommen - mehrmals diktiert:

Zitat
Die Leereflasche und das leere Glas werde ich morgen wegräumen, aber die Leere in meinem Kopf wird mir eine Lehre sein und so schnell leere ich sie nicht wieder.

Nun, kurz gesagt, ich habe den Satz mindestens ein Dutzend Mal diktiert und er war von Anfang an bis zum Ende jedes mal richtig erkannt worden, mit einer einzigen und absolut konstanten Ausnahme. Immer wieder nämlich wurde zu Beginn des Satzes eine unerwünschte Kompositabildung eingefügt, unabhängig davon, ob es sich hierbei um die "Leereflasche" oder um das "Leereglas" handelt, wenn ich die beiden Positionen miteinander ausgetauscht habe. An der Position zwei, wo ebenfalls eine unerwünschte Kompositabildung theoretisch auftreten könnte, ist allerdings stets richtig umgesetzt worden. Woher die möglichen Komposita Bildung und überhaupt herrühren, habe ich weiter oben erklärt.

Nun wird jedem sicherlich klar sein, dass aufgrund der möglichen Mehrfachbesetzungen der Positionen mathematisch betrachtet diverse Alternativen denkbar sind. Konsequenterweise bekommt man auch die volle Liste an Alternativen im Korrekturmenü angezeigt, nämlich 9. In Wahrheit aber sind es noch viel mehr, nämlich ebenso konstant 30 verschiedene Alternativen, wie ich mit einem anderen von mir entwickelten Programm, unter anderem, belegen kann:

Interessanterweise wurden auch bei Verwendung dieses Programms stets und konstant 30 verschiedene Alternativen aufgelistet, die ich nur der Vollständigkeit halber auch noch wiedergeben möchte:

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
 
Number of Last Result Phrases: 30
 
1: die leere Flasche und das leere Glas werde ich morgen wegr&auml;umen ,commaKomma aber die Leere in meinem Kopf wird mir eine Lehre sein und so schnell leere ich sie nicht wieder .periodPunkt
 
2: die leere Flasche und das leere Glas werde ich morgen wegr&auml;umen ,commaKomma aber die Leere in meinem Kopf wird mir eine Lehre sein und so schnell leere ich Sie nicht wieder .periodPunkt
 
3: die leere Flasche und das leere Glas werde ich morgen wegr&auml;umen ,commaKomma aber die Lehrer in meinem Kopf wird mir eine Lehre sein und so schnell leere ich sie nicht wieder .periodPunkt
 
4: die leere Flasche und das leere Glas werde ich morgen wegr&auml;umen ,commaKomma aber die Leere in meinem Kopf wird mir eine Lehre sein und so schnell leere ich sie nicht nieder .periodPunkt
 
5: die leere Flasche und das leere Glas werde ich morgen wegr&auml;umen ,commaKomma aber die Leere in meinem Kopf wirft mir eine Lehre sein und so schnell leere ich sie nicht wieder .periodPunkt
 
6: die Leere Flasche und das leere Glas werde ich morgen wegr&auml;umen ,commaKomma aber die Leere in meinem Kopf wird mir eine Lehre sein und so schnell leere ich sie nicht wieder .periodPunkt
 
7: die leere Flasche und das leere Glas werde ich morgen wegr&auml;umen ,commaKomma aber die Leere in meinem Kopf wird mir eine Lehre sein und so schnell leere ich sie nicht wider .periodPunkt
 
8: die leere Flasche und das leere Glas werde ich morgen wegr&auml;umen ,commaKomma aber die Leere in meinem Kopf wird mir eine Lehre sein und so schnell Lehre ich sie nicht wieder .periodPunkt
 
9: die leere Flasche und das leere Glas werde ich morgen wegr&auml;umen ,commaKomma aber die Leere in meinem Kopf wird mir eine Lehre sein und so schnell Leere ich sie nicht wieder .periodPunkt
 
10: die leere Flasche und das leere Glas werde ich morgen wegr&auml;umen ,commaKomma aber die Lehrer in meinem Kopf wird mir eine Lehre sein und so schnell leere ich Sie nicht wieder .periodPunkt
 
11: die leere Flasche und das leere Glas werde ich morgen wegr&auml;umen ,commaKomma aber die Lehrer in meinem Kopf wird mir eine Lehre sein und so schnell leere ich sie nicht nieder .periodPunkt
 
12: die leere Flasche und das leere Glas werde ich morgen wegr&auml;umen ,commaKomma aber die Leere in meinem Kopf wirft mir eine Lehre sein und so schnell leere ich Sie nicht wieder .periodPunkt
 
13: die Leere Flasche und das leere Glas werde ich morgen wegr&auml;umen ,commaKomma aber die Leere in meinem Kopf wird mir eine Lehre sein und so schnell leere ich Sie nicht wieder .periodPunkt
 
14: die leere Flasche und das leere Glas werde ich morgen wegr&auml;umen ,commaKomma aber die Lehrer in meinem Kopf wirft mir eine Lehre sein und so schnell leere ich sie nicht wieder .periodPunkt
 
15: die Leere Flasche und das leere Glas werde ich morgen wegr&auml;umen ,commaKomma aber die Lehrer in meinem Kopf wird mir eine Lehre sein und so schnell leere ich sie nicht wieder .periodPunkt
 
16: die leere Flasche und das leere Glas werde ich morgen wegr&auml;umen ,commaKomma aber die Lehrer in meinem Kopf wird mir eine Lehre sein und so schnell leere ich sie nicht wider .periodPunkt
 
17: die leere Flasche und das leere Glas werde ich morgen wegr&auml;umen ,commaKomma aber die Lehrer in meinem Kopf wird mir eine Lehre sein und so schnell Lehre ich sie nicht wieder .periodPunkt
 
18: die leere Flasche und das leere Glas werde ich morgen wegr&auml;umen ,commaKomma aber die Leere in meinem Kopf wirft mir eine Lehre sein und so schnell leere ich sie nicht nieder .periodPunkt
 
19: die leere Flasche und das leere Glas werde ich morgen wegr&auml;umen ,commaKomma aber die Lehrer in meinem Kopf wird mir eine Lehre sein und so schnell Leere ich sie nicht wieder .periodPunkt
 
20: die Leere Flasche und das leere Glas werde ich morgen wegr&auml;umen ,commaKomma aber die Leere in meinem Kopf wird mir eine Lehre sein und so schnell leere ich sie nicht nieder .periodPunkt
 
21: die Leere Flasche und das leere Glas werde ich morgen wegr&auml;umen ,commaKomma aber die Leere in meinem Kopf wirft mir eine Lehre sein und so schnell leere ich sie nicht wieder .periodPunkt
 
22: die leere Flasche und das leere Glas werde ich morgen wegr&auml;umen ,commaKomma aber die Leere in meinem Kopf wird mir eine Lehre sein und so schnell Lehre ich sie nicht nieder .periodPunkt
 
23: die leere Flasche und das leere Glas werde ich morgen wegr&auml;umen ,commaKomma aber die Leere in meinem Kopf wirft mir eine Lehre sein und so schnell leere ich sie nicht wider .periodPunkt
 
24: die Leere Flasche und das leere Glas werde ich morgen wegr&auml;umen ,commaKomma aber die Leere in meinem Kopf wird mir eine Lehre sein und so schnell leere ich sie nicht wider .periodPunkt
 
25: die leere Flasche und das leere Glas werde ich morgen wegr&auml;umen ,commaKomma aber die Leere in meinem Kopf wirft mir eine Lehre sein und so schnell Lehre ich sie nicht wieder .periodPunkt
 
26: die Leere Flasche und das leere Glas werde ich morgen wegr&auml;umen ,commaKomma aber die Leere in meinem Kopf wird mir eine Lehre sein und so schnell Lehre ich sie nicht wieder .periodPunkt
 
27: die leere Flasche und das leere Glas werde ich morgen wegr&auml;umen ,commaKomma aber die Leere in meinem Kopf wird mir eine Lehre sein und so schnell Leere ich sie nicht nieder .periodPunkt
 
28: die leere Flasche und das leere Glas werde ich morgen wegr&auml;umen ,commaKomma aber die Leere in meinem Kopf wird mir eine Lehre sein und so schnell Lehre ich sie nicht wider .periodPunkt
 
29: die leere Flasche und das leere Glas werde ich morgen wegr&auml;umen ,commaKomma aber die Leere in meinem Kopf wirft mir eine Lehre sein und so schnell Leere ich sie nicht wieder .periodPunkt
 
30: die Leere Flasche und das leere Glas werde ich morgen wegr&auml;umen ,commaKomma aber die Leere in meinem Kopf wird mir eine Lehre sein und so schnell Leere ich sie nicht wieder .periodPunkt
 

Und nach so viel langer Vorrede komme ich nun zum eigentlichen Thema dieses Vortrags…

Wenn man die vollständige Liste aller möglichen Alternativen betrachtet und sie mit den Alternativen im Korrekturmenü vergleicht, stellt man fest, dass diejenigen Lösungen, die "wenig Sinn machen", in der Versenkung verschwunden sind und nur solche weit oben stehen, die auch nur annähernd in Betracht zu ziehen sind. Dies hängt damit zusammen, wie die Alternativen gegeneinander bewertet werden, und als Grundlage dazu dient eben das Sprachmodell. Wobei es hier allerdings nicht um "Sinn" geht, sondern um Wahrscheinlichkeiten, verglichen mit den Mustern aus den bei der Anpassung des Modells verwendeten Beispieltexten. In jeder Alternative bekommt jede Position (jedes Wort oder jeder zusammenhängende Phrase, sofern sie als solche erkannt wird) einen so genannten confidence score zugewiesen, Sieger ist dann diejenige Alternative mit dem besten Gesamtergebnis.

Wie man diese Funktionalitäten noch näher erforschen und darstellen kann, daran arbeite ich gerade und werde meine Ergebnisse möglicherweise irgendwann präsentieren können.

Viele Grüße
Rüdiger

#10 RE: Vokabulargröße und Performance

Zitat · Antworten

Wow Rüdiger, die von dir und deinen Tools an den Tag gelegte geballte Analyse-Kompetenz zeigt die Bedeutung des Sprachmodells beeindruckend auf!

Aus meiner Froschperspektive dazu nur folgende Ergänzung: Ich habe den – fürchterlich lebensnahen – Beispielsatz auch des Öfteren diktiert. Die fehlerhafte Kompositabildung trat bei mir auch auf, interessanterweise gelang das „so schnell wäre ich sie nicht wieder“, wie man sieht, häufiger daneben. Korrekturen des Einzelwortes brachten wenig, die Lage änderte sich jedoch durchgreifend, nachdem ich einmal die Äußerung im Zusammenhang korrigiert hatte: „ So schnell leere ich sie nicht wieder.“

Mir ist bewusst, dass es unter den Experten streitig ist, ob in der Version 11 die Korrektur im Zusammenhang noch erforderlich ist, um die richtigen Informationen an das Sprachmodell zu senden. Rein subjektiv hatte ich in diesem Beispiel allerdings den Eindruck.

Eines noch: Wie um alles in der Welt kommst du auf deiner Maschine auf einen Performance-Faktor von 0,82? Wurde eine Aufnahme umgesetzt oder war es die 20. Wiederholung? Ansonsten werde ich ja noch blasser vor Neid bzw. muss befürchten, ich wäre ein unfähiger Diktant.

Marius

#11 RE: Vokabulargröße und Performance

Zitat · Antworten

Zitat von Marius Raabe
Eines noch: Wie um alles in der Welt kommst du auf deiner Maschine auf einen Performance-Faktor von 0,82? Wurde eine Aufnahme umgesetzt oder war es die 20. Wiederholung? Ansonsten werde ich ja noch blasser vor Neid bzw. muss befürchten, ich wäre ein unfähiger Diktant.

Nein, keine Aufnahme, genau genommen habe ich den Satz voher dreimal in DragonPad diktiert, und das war die zweite Runde im Testprogramm (beim ersten Mal hatte ich den Faktor 0.86). Also war die Angabe "dutzend Mal" wahrscheinlich mehr ein gefühlter Wert.

Bei mir beobachte ich folgendes: je länger die Äußerungen, desto besser der Faktor (die Performanz), wenn sonst "alles klar" ist.

Aber das ist auch ein Grund dafür, dass ich erst einen neuen Computer kaufen werde, wenn die Leistungsunterschiede zu meinem jetzigen deutlicher werden (wenn das überhaupt noch nachvollziehbar ist), und wenn es gleichzeitig bezahlbar wird.

Gruß, Rüdiger

#12 RE: Vokabulargröße und Performance

Zitat · Antworten

Zitat von R.Wilke
Nun, kurz gesagt, ich habe den Satz mindestens ein Dutzend Mal diktiert und er war von Anfang an bis zum Ende jedes mal richtig erkannt worden, mit einer einzigen und absolut konstanten Ausnahme. Immer wieder nämlich wurde zu Beginn des Satzes eine unerwünschte Kompositabildung eingefügt, unabhängig davon, ob es sich hierbei um die "Leereflasche" oder um das "Leereglas" handelt, wenn ich die beiden Positionen miteinander ausgetauscht habe. An der Position zwei, wo ebenfalls eine unerwünschte Kompositabildung theoretisch auftreten könnte, ist allerdings stets richtig umgesetzt worden. Woher die möglichen Komposita Bildung und überhaupt herrühren, habe ich weiter oben erklärt.

Ein sehr interessanter Beitrag, auch die Links weiter oben führen zu interessanten Postings, wenngleich diese in der Summe etwa einen Gleichstand erzielen bei den Fragen, die beantwortet werden, und den Problemen, die davon ausgehend neu auftauchen .
Ich habe übrigens diesen Ihren Satz probehalber diktiert, und zwar mit meinem „dienstlichen“ Profil, das besonders durch Rechtsbegriffe geprägt ist, und einem Profil, dass ich „privat“ nenne, weil es hauptsächlich der Korrespondenz gewidmet ist, und dann einen älteren Profil, das ich (wie ich nun weiß, vermutlich völlig unnötig) ob seiner Größe stillgelegt habe. Und ich erhielt jedes Mal das gleiche Ergebnis:
Die leere Flasche und das leere Glas werde ich morgen wegräumen, aber die leere in meinem Kopf wird mir eine Lehre sein und so schnell wäre ich sie nicht wieder.
Demnach habe ich das Problem mit dem Kompositum am Anfang des Satzes nicht, hingegen eine Erkennungsungenauigkeit bei „die Leere in meinem Kopf“ und eine weitere dem Ende zu. Die aber, nach dem Kommando „weiter bei schnell“ automatisch korrigiert wird und richtig steht dann „…leere ich sie nicht wieder.“
Demnach ein durchaus beachtliches Ergebnis, was darauf hinweist, dass syntaktisch-semantische Merkmale für die einzelnen Vokabeln hinterlegt sind, die „lehre Flasche“ und „Leere Flasche“ ausschließen.
Übrigens: nach Eingabe der Korrektur tritt die Erkennungsungenauigkeit dem Ende zu nicht mehr auf, also keine Verwechslung mehr mit „wäre“ und „Leere“, wohingegen die Korrektur bei „die Leere in meinem Kopf“ bei Dragon nicht zu einem Lerneffekt geführt hat. Ist an dieser Stelle aber nicht dramatisch, wenn man vorsorglich „die - groß - leere..." diktiert.

DNS 15.3 Professional Individual auf Windows 10 Home (64-bit)
Plantronics PLT Savi W440
Intel (R) Core (TM) i7-7500 2,7 GHz 8 GB RAM 64 Bit

#13 RE: Vokabulargröße und Performance

Zitat · Antworten

Zitat von R.Wilke
Bei mir beobachte ich folgendes: je länger die Äußerungen, desto besser der Faktor (die Performanz), wenn sonst "alles klar" ist.

Das hätte ich auch vermutet, bei mir kann ich diesen Effekt aber nicht feststellen. Während bei längeren und komplizierten Sätzen wie deinem Beispiel die Zahlen immer so zwischen 0,98 und 1,18 liegen, kann es bei kürzeren Ausdrücken sehr viel flotter zu gehen. Einen einzelnen Punkt schaffe ich in 0,43. Meinen Lieblingssatz vom Nikolaus, du weißt schon, auch mal unter 0,9. Aber normalerweise liege ich auf beiden Maschinen etwas über eins. Was soll's, in der Praxis (in der Praxis: 0,81) ist die Korrelation zwischen der gefühlten Geschwindigkeit und der angezeigten ohnehin nicht immer so stark.

Damit das nicht alles völlig off-topic ist, habe ich auch nochmal ein quasi jungfräuliches Benutzerprofil herangezogen. Hinsichtlich der Geschwindigkeit habe ich keine signifikanten Unterschiede festgestellt. Ganz interessant fand ich, dass der Satz sogleich fehlerfrei erkannt wurde, bis auf das falsch gebildete Kompositum. Doch eine Abnutzungserscheinung bei Homophonen? Warten wir es (11.5) ab.

Marius

#14 RE: Vokabulargröße und Performance

Zitat · Antworten

Zitat von Harald
Demnach habe ich das Problem mit dem Kompositum am Anfang des Satzes nicht

Interessant! Sind Sie sicher, dass Sie die automatische Kompositabildung in den Optionen überhaupt aktiviert haben?

Zitat
, was darauf hinweist, dass syntaktisch-semantische Merkmale für die einzelnen Vokabeln hinterlegt sind

Das eben nicht, sondern statistische, was aber in der Praxis zum Glück zumeist darauf hinausläuft, dass das semantisch unsinnige aussortiert wird.

Ich finde insgesamt zeigt Ihr Bericht, dass sich die Profile bei unterschiedlichen Benutzern doch ein klein wenig unterschiedlich entwickeln, was wiederum auf die statistische Funktionsweise, also die individuelle Anpassung des Sprachmodells, zurückzuführen ist.

Beste Grüße, Marius Raabe

#15 RE: Vokabulargröße und Performance

Zitat · Antworten

Zitat von Marius Raabe
Doch eine Abnutzungserscheinung bei Homophonen? Warten wir es (11.5) ab.

Fürchte ich auch (mittlerweile ein Graus bei mir: "Arbeiten versus arbeiten").

Gruß, Rüdiger

Seiten 1 | 2

nächste Seite »

Ähnliche Themen	Antworten/Neu	Letzter Beitrag⁄Zugriffe
Performance der Speecht-to-Text-Funktion Erstellt im Forum Berichte und Tipps von koehlerl	1	07.05.2025 16:35 von Marius_ • Zugriffe: 228

Sprung

Anwenderforum für die Dragon-Spracherkennung

Bitte geben Sie einen Grund für die Verwarnung an