Das ist doch mal Anlass für einen neuen Thread, wenn das Thema auch alt ist:
In einem anderen Thread schrieb Rüdiger:
Zitat von R.WilkeWas den Wortschatz betrifft, der ist von Beginn an schon recht groß (ca. 150.000 Einträge) und kann noch umfangreich erweitert werden (noch mal ca. 150.000 Einträge), bis die Kapazitäten erschöpft sind. Allerdings muss der Hersteller naturgemäß eine Auswahl treffen, welche Einträge in dem Kontingent von 150.000 von Beginn an enthalten sein sollen, und entscheidet daher wohl, mutmaßlich, nach Häufigkeit im allgemeinem Gebrauch. Wenn man demgegenüber die Anzahl von Einträgen bedenkt, die ein durchschnittlicher Anwender im Laufe von Jahren selbst hinzufügt, muss man zu dem Schluss kommen, dass der Hersteller wohl eine gute Wahl getroffen hat. Oder, wie viel benutzerdefinierte Wörter mussten Sie insgesamt im Laufe der Zeit hinzufügen? Gruß, RW
und Karin antwortete:
Zitat von KarinWie viele Wörter ich selbst, also beim Diktieren, hinzugefügt habe, kann ich leider nicht sagen, weil ich Dragon einige umfangreiche Dateien habe auswerten lassen. Insgesamt habe ich rund 22.000 benutzerdefinierte Wörter im Vokabular, trotzdem muss ich bei jedem Diktat neue hinzufügen. Bisher hat das noch nicht abgenommen. 150.000 beziehungsweise 300.000 Wörter hört sich zwar nach sehr viel an, aber wenn man die diversen Flexionsformen abzieht, ist der eigentliche Wortschatz eben doch nicht so groß, jedenfalls für meine Zwecke.
Tja, auch eine Grundsatzdiskussion.
Es gilt: Der Drachen "erkennt" nur, was er schon kennt.
Und: Dass theoretisch die Erkennungsgenauigkeit um so höher ist, je kleiner die Zahl der Vokabulareinträge, war zu Beginn des kommerziellen Einsatzes der Spracherkennung ein Hauptgrund dafür, dass die Technik vor allem für Leute empfohlen wurde, die mit einem relativ begrenzten Wortfeld arbeiten, insbesondere Sachtexte aus immer denselben abgegrenzten Wissensgebieten produzieren. Ebenso war das der Grund für die Empfehlung, für verschiedene Sachgebiete verschiedene Vokabulare zu verwenden. Ebenso wurde das als Begründung für die Produktion von so genannten Fachvokabularen durch Drittanbieter herangezogen. Beim momentanen Entwicklungsstand der Software sind diese Einschränkungen mehr und mehr in den Hintergrund getreten.
Bei mir sind knapp benutzerdefinierte 30.000 Wörter im Vokabular, und es kommt "gefühlt" im Schnitt vielleicht drei- bis fünfmal am Tag vor, dass ich ein neues hinzufüge. Aber das hängt von der Art der Texte ab; geht es um für den Autor bzw. das Profil neue Sachgebiete, steigt die Quote sehr rasch an. In solchen Fällen hilft es zuweilen, vorab Wortlisten einzulesen - vorausgesetzt man verfügt über fehlerfreie –, sozusagen das Fachvokabular des kleinen Mannes.
Es bleibt die Einsicht: Der Diktator-Hansdampf-in-allen-Gassen hat es schwerer mit dem Drachen als der, der nur auf ausgetretenen Pfaden durchs Vokabularfeld stapft.
Es bleibt die Frage: Welche Erfahrungen haben andere Nutzer mit der Vollständigkeit des Vokabulars gemacht? Wie viel benutzerdefinierte Wörter müssen tagtäglich hinzugefügt werden?
Trotzdem möchte ich die Frage wiederholen und wüsste gerne, wie viele benutzerdefinierte Wörter die Anwender jeweils hinzugefügt haben? Oder weiß jemand nicht, wie man sie zählt?
_______________________________________
Dragon Professional 16 auf Windows 10 Pro und Windows 11 SpeechMike Premium (LFH3500); Office 2019 Pro + Office 365 (monatliches Abo) HP ZBook Fury 17 G8 - i7-11800H - 24 MB SmartCache - 32 GB RAM - 1 TB SSD
Zitat von Meinhard??? Wo denn? Wenn sie denn überhaupt mal stattfindet und nicht schlicht ignoriert wird.
Ich war noch nicht fertig.
_______________________________________
Dragon Professional 16 auf Windows 10 Pro und Windows 11 SpeechMike Premium (LFH3500); Office 2019 Pro + Office 365 (monatliches Abo) HP ZBook Fury 17 G8 - i7-11800H - 24 MB SmartCache - 32 GB RAM - 1 TB SSD
Zitat von Meinhard??? Wo denn? Wenn sie denn überhaupt mal stattfindet und nicht schlicht ignoriert wird.
Neuer Versuch, die Diskussion (hier herüber) zu lenken und nochmals fortzusetzen. Dieses Mal vielleicht mittels Umformulierung des Themen-Titels, und zwar:
Vokabularerweiterungsbedarf in der Praxis?
Hintergrund: im anderen Thread habe ich von, meinerseits mutmaßlichen, Größenverhältnissen gesprochen, was die durchschnittliche Anzahl der benötigten benutzerdefinierten Wörter im Vokabular betrifft, und als Antwort darauf prompt Rückmeldungen mit Angaben astronomischer Mengen erhalten - so viel dazu, was den Respekt vor dem Moderator hier im allgemeinen so angeht!
Scherz beiseite, sind diejenigen mit 20.000 bis 30.0000 benutzerdefinierten Wörtern in der Tat zahlreicher, als ich es je vermutet hätte, und sind sie der Meinung, alles richtig zu machen?
Ein staunender RW
_______________________________________
Dragon Professional 16 auf Windows 10 Pro und Windows 11 SpeechMike Premium (LFH3500); Office 2019 Pro + Office 365 (monatliches Abo) HP ZBook Fury 17 G8 - i7-11800H - 24 MB SmartCache - 32 GB RAM - 1 TB SSD
Untertänigst melde ich, dass ich hinsichtlich der benutzerdefinierten Wörter (wie gesagt bei mir knapp 30.000) der Auffassung bin, im Grundsatz alles richtig zu machen.
Zur Erläuterung: Der Bestand hat sich in mehr als einem Jahrzehnt angesammelt, wurde aber beim Versionswechsel immer mal wieder bereinigt (in früheren Versionen kam ich auf bis zu 40.000). Die Bereinigung betraf etwa überflüssige Abkürzungen oder Doppelgänger mit verschiedenen gesprochenen Formen, aber auch Phrasen. Was solche Fälle angeht: Im Laufe der Zeit habe ich eingesehen, dass es häufig mehr Schaden (im Sprachmodell) als Nutzen anrichtet, wenn man versucht den Drachen zu überlisten. Außerdem zwingen die wechselnden Herstellervorgaben etwa hinsichtlich der Berücksichtigung gesprochenen Formen bei der Mitnahme von Vokabularlisten zuweilen zu einer Reduktion. Ich bin schon gespannt, wie das beim Übergang auf Version 13 klappt.
Ein erheblicher Anteil meines Bestands sind juristische Abkürzungen, soweit diese über den beträchtlichen Abkürzungsbestand auch im allgemeinen Vokabular hinausgehen. Einen weiteren erheblichen Anteil machen Flexionsformen von im Prinzip vorhandenen Wortstämmen aus, die der Hersteller vergessen hat bzw. für zu selten erachtete. Auch Eigennamen haben sich angesammelt. Den größten Teil dürften aber Fachwörter aus diversen Sachgebieten ausmachen, mit denen ich so über die Jahre unter einem juristischem Blickwinkel oder anders in Berührung gekommen bin. Sehr viele dieser Ausdrücke schlummern natürlich über lange Zeit ungenutzt im Vokabular, stören aber auch nicht. Denn ungeachtet der theoretischen Nachteile eines größeren Vokabulars für die Erkennungsgenauigkeit bin ich immer wieder frappiert, erstaunt und begeistert, wie gut der Drachen differenzieren kann. Auch jahrelang ungenutzte benutzerdefinierte Vokabulareinträge sind auf Anhieb wieder verfügbar. Einige dieser Vokabular-Leichen enthält der folgende (unsinnige) Satz, der im ersten Anlauf fehlerfrei umgesetzt wurde: „Für das Schmalseitenprivileg des Tümpels gilt ein Festmachverbot, sehr zum Ärger der Festmachereigesellschaft.“ Natürlich befinden sich im Vokabular auch echte falsche Einträge, die bei Korrekturfehlern entstanden sind. Ab und an forste ich mal bestimmte Bereiche durch, um mich zu entspannen…
Zitat von MeinhardIch bin schon gespannt, wie das beim Übergang auf Version 13 klappt.
Dort wenigstens drohen ernste Hindernisse. Verlässlichen Quellen zufolge habe ich erfahren, dass automatisch importierte Wörter nicht so ohne weiteres und auf Anhieb erkannt werden. Das "Training" (der Aussprache) scheint ein größeres Gewicht bekommen zu haben. Aber das sind nur erste Vermutungen.
Aber, um die Provokation fortzusetzen, was spricht eigentlich dagegen, bei der neuen Version noch mal ganz "von vorne" anzufangen? ...
_______________________________________
Dragon Professional 16 auf Windows 10 Pro und Windows 11 SpeechMike Premium (LFH3500); Office 2019 Pro + Office 365 (monatliches Abo) HP ZBook Fury 17 G8 - i7-11800H - 24 MB SmartCache - 32 GB RAM - 1 TB SSD
Zitat von R.WilkeAber, um die Provokation fortzusetzen, was spricht eigentlich dagegen, bei der neuen Version noch mal ganz "von vorne" anzufangen? ...
Ich würde sagen, die nicht unerhebliche Lebenszeit, die über die Jahre für die Eingabe eigenen Vokabulars aufgewendet wurde.
DNS 15.3 Professional Individual auf Windows 10 Home (64-bit) Plantronics PLT Savi W440 Intel (R) Core (TM) i7-7500 2,7 GHz 8 GB RAM 64 Bit
Zitat von R.Wilkewas spricht eigentlich dagegen, bei der neuen Version noch mal ganz "von vorne" anzufangen? ...
Wie die weise Karin schrieb, ist das Hinzufügen von Wörtern die wirksamste Bremse der Arbeitsgeschwindigkeit. Aber wenn die Übernahme nicht ordentlich funktioniert, weil die automatisch generierten „Aussprachen“ nicht passen, ist der Import benutzerdefinierter Wörter natürlich relativ sinnfrei. Das Training von etwa 30.000 nicht zusammenhängenden Wörtern im Rahmen des Imports würde selbst meine Leidensfähigkeit überfordern.
Gibt es denn in den erlauchten und erleuchteten Kreisen schon Informationen, wie als Ganzes aus Version 12.5 importierte Vokabulare sich in Dragon 13 so schlagen?
Zitat von R.WilkeAber, um die Provokation fortzusetzen, was spricht eigentlich dagegen, bei der neuen Version noch mal ganz "von vorne" anzufangen? ...
Ich würde sagen, die nicht unerhebliche Lebenszeit, die über die Jahre für die Eingabe eigenen Vokabulars aufgewendet wurde.
Diese Antwort ist selbstverständlich nicht unerwartet, aber ist es wirklich so? – Anders gefragt: würde man all das, was man über die Jahre hinzugefügt hat, heute noch mal hinzufügen, und mehr noch, würde man es zweckmäßig auf die gleiche Art und Weise hinzufügen?
_______________________________________
Dragon Professional 16 auf Windows 10 Pro und Windows 11 SpeechMike Premium (LFH3500); Office 2019 Pro + Office 365 (monatliches Abo) HP ZBook Fury 17 G8 - i7-11800H - 24 MB SmartCache - 32 GB RAM - 1 TB SSD
Zitat von R.Wilkewas spricht eigentlich dagegen, bei der neuen Version noch mal ganz "von vorne" anzufangen? ...
Wie die weise Karin schrieb, ist das Hinzufügen von Wörtern die wirksamste Bremse der Arbeitsgeschwindigkeit. Aber wenn die Übernahme nicht ordentlich funktioniert, weil die automatisch generierten „Aussprachen“ nicht passen, ist der Import benutzerdefinierter Wörter natürlich relativ sinnfrei. Das Training von etwa 30.000 nicht zusammenhängenden Wörtern im Rahmen des Imports würde selbst meine Leidensfähigkeit überfordern.
Gibt es denn in den erlauchten und erleuchteten Kreisen schon Informationen, wie als Ganzes aus Version 12.5 importierte Vokabulare sich in Dragon 13 so schlagen?
Zu der letzten Frage habe ich keine Informationen, und überhaupt sind alle bisherigen Verlautbarungen lediglich mit der heißen Nadel gestrickt und auf die Vorrunde bezogen, wie es sich bei der finalen Version verhält, kann meines Wissens derzeit noch niemand sagen.
Was die weise Karin betrifft, so gibt sie doch gerade den Beleg dafür ab, dass auch mit einem Arsenal von zusätzlichen 22.000 Wörtern die Notwendigkeit der fortlaufenden Nachbesserung nicht aufgehoben wird, wenn ich sie richtig verstanden habe. Es fragt sich doch, woran das liegt, wurden nicht die passenden Wörter hinzugefügt, müsste man die Zahl verdoppeln, und und und.
Mein Ansatz ist ein ganz anderer, ich möchte die vielen Fehler, die ich über die Jahre, auch beim Hinzufügen von Wörtern, gemacht habe, lieber nicht noch mal machen, und habe daher beschlossen, bei der nächsten Version noch einmal „ganz von vorne“ zu starten. Damit war all die Zeit, die ich über die Jahre damit verbracht habe, eben nicht sinnlos.
So habe ich es übrigens auch schon bei der letzten Version gehalten, und bin für meine Begriffe damit besser gefahren.
Überhaupt gebe ich heute nur noch neue Wörter ins Vokabular ein, wenn ich mir sicher bin, dass ich sie mindestens zwei bis dreimal verwenden werde, ansonsten buchstabiere ich sie halt einfach auf die Schnelle, was unter dem Strich ohnehin schneller ist. Wer die Software lange genug verwendet hat, hat ja in der Regel ein ganz gutes Gespür dafür, ob der nächste intendierte Ausdruck gelingen wird oder nicht, vokabularmäßig, und alleine damit kann man sich schon eine Menge Zeit ersparen, indem man von vornherein den einen oder anderen Weg geht.
Und so kommt es, dass ich innerhalb etwa einen Jahres, nach der „neuen Methode“, meinen vormaligen Bestand aktuell auf ca. 25 % reduziert habe, somit also rund 75 % Altlasten nicht mehr mit mir rumschleppen muss.
Wohlgemerkt, ich rede jetzt hier ausschließlich aus meiner eigenen Perspektive, also die eines professionellen Anwenders mit einem sehr fest umrissenen und stets gleich bleibenden Themenkreis.
_______________________________________
Dragon Professional 16 auf Windows 10 Pro und Windows 11 SpeechMike Premium (LFH3500); Office 2019 Pro + Office 365 (monatliches Abo) HP ZBook Fury 17 G8 - i7-11800H - 24 MB SmartCache - 32 GB RAM - 1 TB SSD
Nur kurz zu der Frage, warum ich nach so vielen hinzugefügten Wörtern immer noch kein Land sehe (und vermutlich auch nicht mehr sehen werde): Ich nutze Dragon zum Übersetzen, und zwar hauptsächlich Belletristik. Ich brauche also eher wenig Fachtermini, und wenn, dann immer wieder aus neuen Bereichen. Dafür ist der verwendete Grundwortschatz wahrscheinlich größer und vor allem breiter gestreut als der, den zum Beispiel ein Zahnarzt beruflich zum Diktieren braucht. Natürlich erwarte ich von Dragon nicht, dass es Eigennamen kennt, klar. Auch bei Umgangssprache, Slang etc. setze ich nichts voraus. Ich bemühe mich außerdem, mich einigermaßen zu disziplinieren, aber beim Übersetzen parallel darüber nachzudenken, ob Dragon das jeweils nächste Wort wohl kennt oder nicht, übersteigt meine Konzentrationsfähigkeit bisher - leider. Und Buchstabieren bringt mich vollkommen aus dem Tritt. Vielleicht sollte ich doch mal in den sauren Apfel beißen und das mehr üben.
DNS Professional Individual 15.61, Windows 11 Insider Preview Version 21H2, Mac Mini M1 mit 16 GB RAM, Parallels Desktop Pro 17.0.0; iPad Pro 2020 mit Parallels Access 6.5.2
ZitatVielleicht sollte ich doch mal in den sauren Apfel beißen und das mehr üben.
Ja, ist ganz einfach, wenn es zur Intuition wird, am besten mit dem Funkalphabet, was man auch schnell verinnerlicht, Beispiel:
schreib [ohne Pause] groß Konrad Anton Richard Ida Nordpol
ergibt: Karin, wenn man die Buchstabennamen flüssig, aber einigermaßen deutlich ausspricht. Voraussetzung für diesen "Schnellbuchstabiermodus" ist, dass der Haken bei "Schreib-Befehle öffnen das Buchstabierfenster" heraus genommen ist, und dass man keine Pause hinter "schreib" spricht.
Belletristik ist sicherlich ein Bereich, der im Vokabular nicht so gut abgedeckt ist.
_______________________________________
Dragon Professional 16 auf Windows 10 Pro und Windows 11 SpeechMike Premium (LFH3500); Office 2019 Pro + Office 365 (monatliches Abo) HP ZBook Fury 17 G8 - i7-11800H - 24 MB SmartCache - 32 GB RAM - 1 TB SSD
Zitat von R.Wilkewürde man all das, was man über die Jahre hinzugefügt hat, heute noch mal hinzufügen, und mehr noch, würde man es zweckmäßig auf die gleiche Art und Weise hinzufügen?
Hallo Rüdiger,
das ist auch für mich die entscheidende Frage und deshalb halte ich es wie Du: Ich fange mit der neuen Version wieder von vorne an. Allerdings wird mein jetziges benutzerdefiniertes Vokabular archiviert. Vielleicht brauche ich es doch noch mal.
Viele Grüße ins Rheinland
Hans
DPI 15 auf Windows 10 Professional (64-bit) SpeechMike Premium. Intel i7 Core 4x2.67 GHz, 6 GB RAM
Selbstverständlich sollte man den Bestand auf jeden Fall archivieren und evtl. am Anfang zweigleisig fahren. Eine komplette Profil-Neuanalage ist auch nicht zu empfehlen, wenn man gerade arg unter Termindruck steht.
Viele Grüße nach Bayern! Rüdiger
_______________________________________
Dragon Professional 16 auf Windows 10 Pro und Windows 11 SpeechMike Premium (LFH3500); Office 2019 Pro + Office 365 (monatliches Abo) HP ZBook Fury 17 G8 - i7-11800H - 24 MB SmartCache - 32 GB RAM - 1 TB SSD