Ich habe heute von unseren Technikern die Nachricht erhalten, dass es nicht sinnvoll ist, den Kollegen eine Liste mit neu gelernten Vokabeln zur Verfügung zu stellen, weil die Hintergrundinformationen nicht mit übertragen werden und Dragon dann langsamer wird, weil es immer in der Bibliothek nach Hintergrundinformationen sucht. Das finde ich sehr schade, weil ich meine 6000 Wörter gerne zur Verfügung stellen möchte. Kann es da wirklich keine Lösung geben? Viele Grüße A. Meinhart
DNS 12 (12.50.000.080) auf Windows 7 Professional (32-bit) Plantronics Headset Thinkcentre ACPIx86 basierter PC-Intranet
Zitat von anton.meinhartdass es nicht sinnvoll ist, den Kollegen eine Liste mit neu gelernten Vokabeln zur Verfügung zu stellen, weil die Hintergrundinformationen nicht mit übertragen werden und Dragon dann langsamer wird, weil es immer in der Bibliothek nach Hintergrundinformationen sucht.
Also, ich finde, das ist absoluter Blödsinn. Gruß, Pascal
Zitat von P.RochAlso, ich finde, das ist absoluter Blödsinn.
Genau. Wenn mit "neu gelernten Vokabeln" benutzerdefinierte Wörter gemeint sind, trifft es zu, dass sie über keine "Hintergrundinformationen" (Daten im Sprachmodell hinsichtlich Häufigkeit und Kontext, in denen sie erscheinen) verfügen und solche Informationen folglich auch nicht übertragen werden können.
Das tut der Sache aber keinen Abbruch, so lange es sich um Wörter handelt, die die Kollegen möglicherweise auch verwenden werden, aber noch nicht ins Vokabular aufgenommen haben.
_______________________________________
Dragon Professional 16 auf Windows 10 Pro und Windows 11 SpeechMike Premium (LFH3500); Office 2019 Pro + Office 365 (monatliches Abo) HP ZBook Fury 17 G8 - i7-11800H - 24 MB SmartCache - 32 GB RAM - 1 TB SSD
Ja, die Aussage der "Techniker" ist wirklich unsinnig. Wenn zu einem Vokabulareintrag wenig spezifische Sprachmodell-Daten vorhanden sind, gibt sich Dragon keine Mühe, irgendwo danach zu suchen - wo auch? Dafür gibt es im Programm gar keinen Ort. Ohne solche spezifischen Daten mag die Fehlerwahrscheinlichkeit etwas höher sein als bei altvertrauten Wörtern, aber immer noch viel geringer als bei einem fehlenden Eintrag - da ist sie nämlich 100 %, und die Korrektur dauert sicher länger.
Ein halbwegs sinnvoller Punkt wird aus der Aussage allenfalls insoweit, als man die Verarbeitung kompletter Dokumente mit den neuen Wörtern ("von bestimmten Dokumenten lernen") in dem Sinne für die bessere Methode halten könnte, dass sie zugleich einen Kontext zum neuen Wort vermittelt. Andererseits ist das eben auch nur ein Kontext von vielen möglichen, und es wird kaum einen sinnvollen Text geben, in welchem alle gewünschten neuen Wörter in einem sinnvollen Kontext vorkommen.
Mein Drachen jedenfalls bekommt bei Anlage eines neuen Profils ca. 25 000 benutzerdefinierte Wörter (Liste im XML-Format, also mit abweichenden geschriebenen/gesprochenen Formen und Formatierung) vorgesetzt. Das Profil ist nicht langsamer als ohne diese.
Zitat von MeinhardEin halbwegs sinnvoller Punkt wird aus der Aussage allenfalls insoweit, als man die Verarbeitung kompletter Dokumente mit den neuen Wörtern ("von bestimmten Dokumenten lernen") in dem Sinne für die bessere Methode halten könnte, dass sie zugleich einen Kontext zum neuen Wort vermittelt. Andererseits ist das eben auch nur ein Kontext von vielen möglichen, und es wird kaum einen sinnvollen Text geben, in welchem alle gewünschten neuen Wörter in einem sinnvollen Kontext vorkommen.
Genau. Es wäre, oder ist, eine gigantische Aufgabe, ausreichend Textmaterial im Zusammenhang mit der Dokumentanalyse zur Verfügung zu stellen, um das Sprachmodell in annähernd gleicher Effizienz hinsichtlich benutzerdefinierter Wörter anzupassen wie das eingebaute Vokabular. Anders formuliert, die Datenmenge, die der Hersteller verwendet, um ein Vokabular mit Sprachmodellinformationen zusammen zu stellen, sprengt bei weitem den Aufwand, den ein Einzelanwender betreiben kann - und wie ich mir mal habe sagen lassen, die Rechnerleistung eines privaten PC, wenn das kein Gerücht war.
Deshalb sind herstellerseitige Vokabulare auch so "wertvoll", und nebenher gehandelte "Spezial-Vokabulare" im Grunde wertlos, wenn man davon absieht, dass es sich dabei um mehr oder weniger repräsentative Wortsammlungen handelt.
Vor vielen Jahren habe ich mir mal die Mühe gemacht, einige Hundert Seiten an bestehenden Texten aus meiner Sammlung aufzubereiten und zusammen zu stellen, zur Verwendung für die "Anpassung" des Sprachmodells. Unterm Strich hat sich die Mühe nicht gelohnt, muss ich im Nachhinein sagen.
Anhand bestimmter, seit jeher problematischer Einzelfälle kann ich aber mittlerweile behaupten, dass die einmalige Korrektur im Falle einer Verwechselung bei der Erkennung die zuverlässigste Methode der "Anpassung" ist - zumindest seit Version 13, im Unterschied zu allen Vorversionen.
_______________________________________
Dragon Professional 16 auf Windows 10 Pro und Windows 11 SpeechMike Premium (LFH3500); Office 2019 Pro + Office 365 (monatliches Abo) HP ZBook Fury 17 G8 - i7-11800H - 24 MB SmartCache - 32 GB RAM - 1 TB SSD
Ja, ich kann mich noch gut an Deine früheren Empfehlungen betreffend Textkorpus oder Wortliste erinnern.
Vor allem mit Schrecken erinnere ich mich noch daran, wie ich vor vielen Jahren mal anhand eines Textkorpus mithilfe des früheren Voctool in den sagenhaften "middle slot" eingegriffen habe und dabei angegeben habe, das bestehende Sprachmodell zu überschreiben. Das Benutzerprofil konnte man praktisch wegwerfen.
Darum bekomme ich immer noch einen kleinen Schreck, wenn bei der tatsächlichen Verwendung der Funktion „von bestimmten Dokumenten lernen“ mit „Schreibstil anpassen“ die Meldung kommt „Sprachmodell wird erstellt“. Tatsächlich ist damit wohl gleichsam eine zusätzliche Schicht im Modell gemeint – ob diese viel nützt oder nicht, habe ich nicht systematisch untersucht. Jedenfalls bin ich auch schon sehr gut mit Profilen ohne diese individuelle Anpassung ausgekommen – letztlich nur ein weiteres Indiz dafür, dass die eingangs vom Fragesteller thematisierte Auskunft seiner „Techniker“ nicht korrekt ist.
Ein weiteres Indiz dafür ist, dass jedenfalls bei mir benutzerdefinierte Wörter aus meiner Liste typischerweise auf Anhieb erkannt werden.
Radikaler gesagt: Wenn man auf benutzerdefinierte Wörter verzichten würde, wäre das das Ende der Vorteile einer benutzerspezifischen Frontend-Spracherkennung wie Dragon, man könnte dann ja gleich auf eines der neueren Online-Tools umsatteln. Dass Nuance mit Dragon Anywhere versucht, die Vorteile benutzerdefinierter Wörter in die Online-Welt der Spracherkennung per Smartphone usw. zu übertragen, spricht ja gleichfalls Bände.
Vielen Dank für diese vielversprechenden Antworten!
Ich werde gleich morgen unseren EDV-Spezialisten in Wien die ganze Diskussion schicken und bin sehr gespannt auf die Reaktion. Sie haben nämlich sogar mitgeteilt, diesbezüglich bei Nuance nachgefragt zu haben und die Auskunft niemand geringerem gegeben, als unserem Bundesministerium für Justiz.
Nochmals Danke und viele Grüße A. Meinhart
DNS 12 (12.50.000.080) auf Windows 7 Professional (32-bit) Plantronics Headset Thinkcentre ACPIx86 basierter PC-Intranet
Zitat von anton.meinhartSie haben nämlich sogar mitgeteilt, diesbezüglich bei Nuance nachgefragt zu haben
Ja wenn das so ist, nehmen wir alles zurück, denn Nuance hat natürlich immer recht. [Irony]. Im Ernst: der Kundendienst des Herstellers ist berüchtigt dafür, nicht korrekte Auskünfte zu geben – Hauptsache, man ist den Kunden schnell wieder los. An die Entwickler kommt man als Kunde – Bundesministerium eines mitteleuropäischen Landes hin oder her – im Zweifel nicht heran. Außerdem ist natürlich ein "Stille-Post-Effekt" nicht auszuschließen.
Zitat von MeinhardAußerdem ist natürlich ein "Stille-Post-Effekt" nicht auszuschließen.
Eben. Denn eigentlich wissen wir nicht, was ursprünglich bei Nuance erfragt wurde, was genau die geantwortet haben, und letzten Endes wissen wir auch nicht, was genau die "Techniker" gesagt haben. Auf diesem wackligen Fundament bauen wir eine tiefgründige Diskussion auf... Ich schlage vor, die erstmal zu beenden. Gruß, Pascal
Zitat von P.RochAuf diesem wackligen Fundament bauen wir eine tiefgründige Diskussion auf...
Danke für die Blumen. Wir haben inhaltlich die konkret von A. Meinhart gestellte Frage behandelt, vielleicht etwas weitschweifiger als Du, vielleicht aus Lust am Fabulieren, vielleicht in der vagen Hoffnung, dass es so verständlicher würde. Da gab es hier schon sinnfreiere und nicht formal beendete Diskussionen, haha (Homonym zu H.H.).
Zitat von P.Roch Auf diesem wackligen Fundament bauen wir eine tiefgründige Diskussion auf... Ich schlage vor, die erstmal zu beenden.
Höre ich da eine Spur von Kritik heraus? -
In der Tat, die hintergründigen Verflechtungen, aus deren Kontext die Frage ursprünglich stammt, und dass sie erst im Nachhinein offenbar werden, geben dem Ganzen ein gewisses Kolorit, um es mal vorsichtig zu formulieren.
Wie Meinhard schon sagte, so wie die Frage gestellt wurde, ist sie beantwortet worden - nicht mehr und nicht weniger.
_______________________________________
Dragon Professional 16 auf Windows 10 Pro und Windows 11 SpeechMike Premium (LFH3500); Office 2019 Pro + Office 365 (monatliches Abo) HP ZBook Fury 17 G8 - i7-11800H - 24 MB SmartCache - 32 GB RAM - 1 TB SSD
ich glaube es war im Jahr 2004, als Nuance vom österreichischen Bundesministerium für Justiz eine Riesenmenge an Daten (Daten + Protokolle etc.) auf einer DVD erhalten hat, damit der " Hersteller“ des Programms für das österreichische Bundesministerium ein Vokabular baut und im Gegenzug natürlich auch gegen zusätzliche Bezahlung Programmlizenzen vom Bundesministerium für Justiz angekauft wurden.
Ich kann mich gut noch an diese Situation erinnern, ich konnte sie sozusagen aus 1. Reihe fußfrei miterleben. Die Datenaufbereitung muss man sich etwa so vorstellen, dass Rechtspraktikanten (für deutsche Mitleser gewissermaßen Azubis in der Rechtsanwendung) Daten anhand von Urteilen, Protokollen etc. aufgearbeitet haben, ein bisschen etwas vom Rechtsinformation-System des Bundes dazu gemischt wurde und dann vom damaligen Importeur der Dragon Software für Österreich mittels DVD an Nuance Deutschland zur Weiterverarbeitung in den USA geschickt wurde.
Im Gegenzug hat das Bundesministerium für Justiz von Nuance hat damals glaube ich 100 Lizenzen gekauft, die dann in weiterer Folge auf 200 Lizenzen aufgestockt wurden. Ich habe mich vor etwa 2-3 Jahren bei dem dem verantwortlichen Sektionschef des Bundesministeriums für Justiz erkundigt und erhielt die Information , dass von diesen 200 Lizenzen die vom Bundesministerium für Justiz gekauft wurden etwa eine handvoll ständig genutzt (power User), der Rest benutzt das Programm gelegentlich und eine große Anzahl überhaupt nicht.
Das wundert auch nicht, da bei der Datenaufbereitung für die Vokabularerstellung die rechte Hand nicht wusste was die linke tut-die Rechtspraktikanten (Azubis) hatten wenig Ahnung über die Relevanz bzw. der Aufbereitung der Daten und der „Hersteller “ in den USA, der auf seiner „Serverfarm“ das Vokabular erstellen ließ keine besonders genaue Kenntnis der deutschen Sprache. (Stichwort Exekutor = deutsch [Vollstrecker], aufgenommen vom „Hersteller“ Exekuter= ist nicht deutsch, klingt dafür Englisch hat aber keine Bedeutung in der EO.
Dies nur zur " Werthaltigkeit“ eines herstellerbezogenen Vokabulars.
Da wundert es nicht, dass „anton.meinhart“ sich nach einer Verbesserung der Datenbank und das ist das Vokabular letztlich, sehnt.
Ich für meinen Teil verwende jedenfalls eine Datenbank (Vokabular) mit ca. 310.000 Wörtern das sind ca. um 150.000 Wörter mehr als das Vokabular von Dragon Out-of-the-Box hat. Sicherlich werde ich nur ein Bruchteil von diesen Wörtern tatsächlich verwenden aber ab einer gewissen statistischen Größe kann man davon ausgehen, dass man nicht nur die Wörter im Vokabular hat, die man schon einmal verwendet hat, sondern auch jene, die man in Zukunft verwenden wird, wodurch der Korrekturaufwand gegen 0 geht.
Und da möchte ich noch eine Lanze für die Sinnhaftigkeit eines fachbezogenen Vokabulars brechen. Ich habe mir vor einigen Jahren den Luxus geleistet ein solches -nicht von Nuance, sondern von einem privater Anbieter erstelltes Fachvokabular- anzukaufen, für dieses Fachvokabular gibt es auch immer wieder Upgrades, derzeit verwende ich DPI 14 + das aktualisierte Fachvokabular meines privaten Anbieters (er ist Berufskollege und weiß daher worauf es beim Diktieren und der Erstellung von Texten ankommt).
Ich bin damit ausgezeichnet unterwegs. Von irgendwelchen Latenzen die mit der Größe der Datenbank einhergehen könnten kann ich nichts berichten, im Gegenteil, das gesprochene Wort wird sofort abgebildet und schneller als man spricht braucht das Programm auch nicht zu schreiben.
Und dafür benötigt man eigentlich gar keinen Supercomputer mehr, ich merke kaum einen nennenswerten Unterschied zwischen meinem Standcomputer, der einen auf 4,5 GHz hochgetakteten Intel® Core™ i7-4820K Processor mit 10 MB Cache und 32 GB Arbeitsspeicher und eine SSD Platte von 1 GB hat und meinem neuen Lenovo Laptop mit Intel Core M-5Y70, mit nur 2x 1.10GHz [allerdings Turbomodus 2,7 GHz] • RAM: 8GB DDR3 • Festplatte: 512GB SSD.
Also die 6000 Wörter von anton.meinhart, sofern sie dem deutschen Sprachmodell entsprechen sollten kein Problem sein, aber die sogenannten „Techniker“ standen Spracherkennungssoftware immer schon skeptisch gegenüber und daher auf der Bremse. Doch davon sollte man sich nicht aufhalten lassen.
Eine Klarstellung sei gleichwohl erlaubt: die Verwendung eines benutzerdefinierten Vokabulars ist etwas anderes als die Hinzufügung von benutzerdefinierten Wörtern aus einer Liste. Im erstgenannten Fall kommen zu den Wörtern eben auch die sonstigen Informationen des Sprachmodells hinzu, insbesondere über relative Häufigkeiten von Wörtern im Verhältnis zu anderen in bestimmten Wortfolgen (n-grammen). Diese Informationen sind aber eben nur so gut wie der Ersteller des Vokabulars sie hat werden lassen. Darauf bezog sich Rüdigers Hinweis, der im Übrigen gerade nicht auf "Built-to-order"-Spezialvokabulare bezogen war, sondern auf die standardmäßigen Vokabulare, denen mutmaßlich eine noch riesigere Riesenmenge von Daten zugrunde lag als dem geschilderten österreichischen Justiz-Projekt, dessen Verlauf ausgehend von dem Bericht ja einigermaßen beklagenswert ist.
Diskussionen über Sinn und Unsinn der Auffüllung des vorgegebenen Vokabulars mit sehr großen Zahlen von benutzerdefinierten Wörtern wurde hier schon vor Jahren geführt, ebenso zur Obergrenze. Vgl. etwa hier:
Obwohl ich Nuance mittlerweile wirklich viel Unsinn zutraue (als gelegentlicher Nutzer von Dragon für Mac habe ich da so meine Erfahrungen), vertraue ich bequemlichkeitshalber darauf, dass die vom Hersteller aufrecht erhaltene Unterscheidung zwischen Vordergrund- und Hintergrundvokabular nach wie vor ihren Sinn hat, also der Umstand, dass das Programm nicht die gesamten (gerüchteweise) 400.000 Einträge zur sofortigen Auswahl stellt.
Und noch etwas: Rein subjektiv glaube ich, dass ich mit dem allgemeinen Vokabular im Durchschnitt meiner Texte etwas bessere Trefferquoten erziele als mit dem juristischen (des Herstellers).
Aus strategischer Sicht schließlich würde ich es der langfristigen Durchsetzung der Spracherkennung im Sinne einer „Diktiersoftware“ eher für abträglich halten, wenn sich der Eindruck verbreitet, dass man für einen wirklich guten Einsatz noch ein Spezialvokabular benötigt (wobei mir bewusst ist, dass Nuance diesen Eindruck durch die juristischen und medizinischen Editionen ein Stück weit selbst vermittelt – siehe dazu oben).
Aber wie sagte angeblich ein angeblich zweitgrößter Vorsitzender: Egal, ob eine Katze schwarz oder grau ist, Hauptsache, sie fängt Mäuse.
Dennoch, „ Size Matters“-wer's nicht glaubt braucht nur in Google Docs -> Tools > Spracheingabe aktivieren-> einschalten und dann mit Spracheingabe ein Dokument erstellen. Unglaublich was die für eine Datenbank, die mit einer Speechengine verknüpft ist, haben müssen. Und diese Spracheingabe funktioniert vollkommen ohne Sprechertraining egal ob Mann oder Frau. Ich meine, dass die Spracheingabe jetzt für Google Docs freigegeben ist, ein wesentlicher Grund dafür ist, dass entgegen dem Produktzyklus von 2 Jahren für Dragon plötzlich bereits nach 1 Jahr eine neue Version mit Dragon Anywhere auf den Markt kam.