1

Thema: Wie kann das Vokabular individuell optimal angepasst werden?

Hinweis: Das folgende Thema war erst zur späteren Behandlung bei den "Grundlagen" geplant, wird aber aus aktuellem Anlass vorgezogen.

--------------------------------------------------------

Die schärfste Waffe im Drachenkampf - genitivus subjectivus, wohlgemerkt - ist ein maßgeschneidertes Vokabular. Ältere Leser des KnowBrainer-Forums, wo dieses Thema schon etliche Male behandelt wurde, werden bereits wissen, was dafür zu tun ist. Benötigt werden drei Dinge: (1) ein Vorrat an thematisch und stilistisch repräsentativen Dokumenten, (2) viel Zeit zur Präparation einer mehr oder weniger großen Auswahl davon, und (3) das Know-how.

Wer beruflich diktiert, hat in der Regel (1) zur Genüge, und (2) kann er oder sie auch delegieren. (3) umfasst das Wissen, wie die Dokumente für die anschließende Extraktion des benutzerspezifischen Wortschatzes und Anpassung an den Schreibstil aufzubereiten sind, und wird im folgenden ausführlich erklärt.

Schon bei der Auswahl der Texte ist Sorgfalt angebracht, hier sollten nur solche herangezogen werden, die exemplarisch in Inhalt, Wortwahl und Form sind, aber keine "Gelegenheitsarbeiten", wie Notizen, Mails oder sonstige Ausreißer. Unterschiedliche Themen können im Ergebnis miteinander vermischt werden, nur der Ordnung halber ist es anzuraten, die Textsorten von Beginn an getrennt zu halten, etwa Gutachten und Schreiben. Sinnvoll ist eine Datenmenge von mindestens 100 Textseiten in Dokumenten kurzer bis mittlerer Länge, je größer aber die Gesamtmenge, desto höher der Gewinn.

Der meiste Aufwand und die allergrößte Sorgfalt aber ist für die Präparation der Texte aufzuwenden. Hierbei ist zu bedenken, dass bei der späteren Textanalyse sämtliche noch nicht im Vokabular von Dragon noch nicht enthaltenen geschriebenen Formen als benutzerdefinierte Einträge identifiziert werden. Dazu zählen daher nicht nur Fachausdrücke und Eigennamen, sondern auch Abkürzungen, Aktenzeichen und schließlich sämtliche Zahlen - Zahlen in Dragon sind Wörter, nicht Ziffern!
Die Texte sind daher grundsätzlich Wort für Wort durchzuarbeiten und nach den o.g. Kriterien umzuarbeiten, indem

(a) lediglich die reinen Textkörper verwendet werden, Briefköpfe, Betreffs o.ä. dagegen gleich heraus genommen werden;
(b) im Textkörper irrelevante Eigennamen durch "Müller" oder geläufige Kontaktpersonen ersetzt werden;
(c) Zahlen entweder durch Wörter ersetzt oder die Texte entsprechend umformuliert werden, jedoch ohne den Satzbau zu zerstören;
(d) Abkürzungen entweder ersetzt oder in gesprochene Formen umgewandelt werden, z.B. "1. Etage" in "erste Etage"; und
(e) sämtliche Orthographie- und sonstigen Tippfehler ausgemerzt werden, denn würde z.B. nach einem Satzzeichen die Leerstelle fehlen, würde das Wort davor, das Satzzeichen und das darauf folgende Wort in zusammenhängender Einheit als "neues Wort" identifiziert.

Bei diesen Aufgaben ist die Such- und Ersetz-Funktion in Word äußerst praktisch, und nicht zuletzt die Rechtschreibprüfung. Letztgenannte ist ganz zum Schluss ohnehin noch einmal das Maß aller Dinge.

Wenn die Texte dann in der Art aufbereitet sind, werden sie als Word-Dokumente archiviert - für eventuelle spätere Verwendung -, und Kopien davon werden innerhalb von Word in RTF oder TXT Dokumente umgewandelt. Das ist wichtig für die spätere Dokumentanalyse, wo Formatierungen für den Prozess nicht dienlich sind, ihn aber empfindlich stören können.

An diesem Punkt angekommen, ist der Rest ein Kinderspiel. Als nächstes werden die RTF oder TXT Dokument der Textanalyse in Dragon übergeben, und zwar bei einem neuen Profil, dem noch keine Wörter hinzugefügt worden sind. Wie man solch ein Profil in zwei Minuten erstellt, wird im 1. Schritt in den "Grundlagen" erklärt.

Wenn das Profil geladen ist, geht man in Dragon auf "Extras - Erkennungscenter - Wörter aus Dokumenten hinzufügen". Dort wird man aufgefordert ein einzelnes oder mehrere Dokumente für die Analyse anzugeben, oder gleich einen ganzen Ordner mit Dokumenten. Man wählt die Option, dass unbekannte Wörter gesucht werden sollen, aber nicht, dass die Anpassung an den Schreibstil vorgenommen werden soll.

Je nach Datenmenge dauert der nächste Schritt ein paar Sekunden bis Minuten. Als nächste wird eine Liste mit den neu gefundenen Wörter angezeigt, die man hier noch mal durchsehen kann, was aber nicht anzuraten ist, wenn es sich um eine große Menge handelt, etwa Tausende von Wörtern, gleich wird erklärt, wie das einfacher geht. Man bestätigt alles, was sonst noch gefragt wird, und speichert das Profil.

Danach geht man auf "Wörter -exportieren", und folgt den Anweisungen. Die vorhin gefundenen neuen Wörter werden dann als Liste in eine TXT Datei exportiert, Namen und Speicherort muss man noch angeben. Dann schließt man das Profil, und kann es auch löschen, warum, folgt jetzt.

Die soeben exportierte Datei (TXT) öffnet man in Word und durchsucht sie noch einmal mit der Rechtschreibfunktion, ggf. auch "visuell". Hintergrund: selbst bei sorgfältigster Aufbereitung der Texte werden immer mal Fragmente "gefunden", die einfach nicht in den Eingabe-Texten zu identifizieren sind, und somit auch nicht daraus zu löschen. Wenn die Liste somit endgültig bereinigt ist, speichert man sie und deponiert eine Kopie davon an einem sicheren Ort - sie ist nun Gold wert.

Dann nimmt man wiederum ein ganz neues Profil und importiert als erstes die Wortliste, damit sind alle benutzerdefinierten Wörter, aufs Feinste extrahiert und destilliert, in das Profil und speichert es. Danach ruft man wieder die Funktion "Wörter aus Dokumenten hinzufügen" auf und verwendet dazu noch einmal die Mustertexte, ABER, dieses Mal lässt man nicht nach neuen Wörtern suchen - die sind ja schon da -, aber nimmt die Anpassung an den Schreibstil vor. Wenn das erledigt ist, speichert man das Profil und legt eine Kopie davon an einem sicheren Ort ab.

So, das wäre alles für den Moment, demnächst behandeln wir dann, wie das Vokabular noch weiter angepasst werden kann, indem den benutzerdefinierten Wörter bei Bedarf gesprochene Formen hinzugefügt werden, sowie durch Veränderung der Worteigenschaften.

DPI 15.3 (15.30.000.006) auf Windows 8.1 (64-bit)
SpeechMike Premium (LFH3500) mit Philips Device Control Center (3.0)
Intel i7 2600 QuadCore - 3.4 GHz - 8 MB L3-Cache - 6 GB RAM

2

Re: Wie kann das Vokabular individuell optimal angepasst werden?

Lieber Herr Wilke,

vielen Dank für die ausführliche Beschreibung. Eine Frage hätte ich:
Ist die Methode, bei welcher die „Anpassung an den Schreibstil“ – also doch wohl die Erstellung/Anpassung des Sprachmodells – auf der Basis einer langen Liste einzelner Wortformen geschieht, tatsächlich optimal? Ich hätte vermutet, dass damit der wesentliche Vorteil der Dokumentsammlung, nämlich eine Analyse der Häufigkeit der jeweiligen Wortfolgen zu ermöglichen, damit verloren geht (beim Export der TXT-Liste können Daten über die Zusammenhänge doch wohl nicht mit exportiert werden).

Gruß, M. Raabe

Dragon NaturallySpeaking 11.5 Legal
Windows 7 Prof. 64-Bit, Office 2010, Jarte Plus
Philips SpeechMike II Pro Plus, SpeechMike III, SpeechMike Air, PDCC 2.8
Intel Core2 Quad Q9550, 2,83 GHz, 2x6MB L-2, 8 GB RAM

3

Re: Wie kann das Vokabular individuell optimal angepasst werden?

Guten Morgen, Herr Raabe,

gut, dass Sie nachfragen, vielleicht habe ich diesen Aspekt nicht deutlich genug heraus gestellt, was leider bei längeren Aufsätzen schnell passiert. Es war auch mehr als Anleitung in Form eines "How To" gedacht, ohne all zu viel Hintergrundtheorien.

Beim Import von Wörtern aus einer Liste, wie beschrieben, wird die Anpassung an den Schreibstil (Sprachmodell, d.i. statistische Häufigkeit der Wörter an sich und in bestimmten Kontexten) selbstverständlich NICHT vorgenommen. Diese Import-Methode wird durchgeführt entweder über "Wörter - Importieren", oder im Erkennungscenter "Wörter aus einer Liste importieren".

Aber, eine Grundidee meiner Vorgehensweise besteht ausdrücklich darin, die Wortliste (ohne Kontexte) im ersten Schritt separat zu importieren, nachdem die Liste fein säuberlich aus den Mustertexten destilliert wurde,  und dann erst im zweiten Schritt die Anpassung an den Schreibstil vorzunehmen, ohne dabei nach neuen Wörtern suchen zu lassen, weil die schon "da" sind, nach dem ersten Schritt. Der Effekt ist nach meiner Beobachtung derselbe. Testen Sie es, wenn es von Interesse ist - etwas  anderes kann ich mir kaum vorstellen.

Nach dem bloßen Import der benutzerdefinierten Wörter - ohne Anpassung des Sprachmodells - werden diese in komplizierten Kontexten nicht so zuverlässig verwendet. Aber, wenn Sie anschließend mittels der Mustertexte das Sprachmodell anpassen, mit den schon im Vokabular enthaltenen Wörtern, werden typische Kontexte gemäß den Mustertexten wesentlich passender erkannt.

WICHTIG: Das Vademecum des Drachenkämpfers (gen. subj., der zusammen mt dem Drachen kämpft) sind die "Mustertexte", das sind die für den Diktierenden repräsentativen und relevanten Texte, wovon alles abhängt, und die sollte jeder im Tornister haben.

Ein Fingerzeig für den Vokabularbau?

Rüdiger Wilke

DPI 15.3 (15.30.000.006) auf Windows 8.1 (64-bit)
SpeechMike Premium (LFH3500) mit Philips Device Control Center (3.0)
Intel i7 2600 QuadCore - 3.4 GHz - 8 MB L3-Cache - 6 GB RAM

4

Re: Wie kann das Vokabular individuell optimal angepasst werden?

Als Homoeopath muss ich ein hochspezifisches Vokabular benutzen. Die nachfolgende Vorgehensweise eignet sich aber fuer jeden, der "sein persönliches" Vokabular erstellen will. Bitte lassen Sie sich nicht abschrecken, das ist sehr einfach, wenn man es einmal gemacht hat.
1. Wenn Sie ein fachspezifisches (Lehr)buch ueber das Thema in elektronischer Form haben, das Sie im TXT-Format haben oder es darin verwandeln koennen, (z.B. mit "speichern unter"), arbeiten SIe damit.
2. Wenn Sie nur Dokumente haben, kopieren Sie moeglichst viele davon (!) in EIN großes Dokument und speichern das als TXT-Format; damit sind stoerende Text(Schrift)Formatierungen entfernt.
3. Laden Sie im INternet das Konkordanz-Program TEXTSTAT herunter. Adresse: www.niederlandistik.fu-berlin.de/textstat/software-en.html
4. INstallieren Sie das Programm und importieren Sie in TEXTSTAT Ihr Mammutdokument.
5. In Sekundenschnelle macht Textstat daraus eine Wortliste, die man nach HAEUFIGKEIT sortiert ansehen kann.
6. Kopieren Sie die Wörter der Haeufigkeit bis ca "3" in ein neues Dokument im TXT-Format.
7. Bearbeiten Sie dieses Dokument: Löschen Sie Eigennamen, wenn Sie diese nicht oft brauchen (aber da sie mehr als dreimal in Ihren Texten stehen, brauchen Sie die eigentlich...)
8. WICHTIG !!! Loeschen SIe alle Woerter, die GROSS geschrieben sind, weil sie im BEispieltext am Satzanfang standen !!!! Also: "Damit" muss geloescht werden, weil "damit" im TExtfluss immer KLEIN geschrieben wird.
9. Teilen SIe dieses Dokument auf oder kopieren SIe immer die Anzahl Woerter in ein neues Dokument, wie SIe jeweils trainieren wollen in einer Sitzung mit DRAGON
10. Das weitere Vorgehen ist im Artikel von Herrn Wilke genau beschrieben.
11. Warum so "kompliziert"?
Mittels der Haeufigkeitsanalyse arbeiten SIe zielgenau diejenigen Wörter ein, die besonders oft auftreten. Dragon muß also nicht jeden Text "Wort fuer Wort" mit dem eingebauten Vokabular vergleichen....
12. TIP: Bei GOOGLE BOOKS kann man jede Menge Fachbücher runterladen und verwursten.
Denn man viel Spass
Homoeopath
Dragon 10.1 preferred (deu/eng) Intel CoreDuo 3,33 GHZ 1GB Ram (mehr schaffen alte Fachprogramme nicht...) Sennheiser USB Headset WIN XP SP2

5

Re: Wie kann das Vokabular individuell optimal angepasst werden?

R.Wilke schrieb:

Die schärfste Waffe im Drachenkampf - genitivus subjectivus, wohlgemerkt - ist ein maßgeschneidertes Vokabular.

Hallo Rüdiger,

was ist mit meinen benutzerdefinierten Vokabeln, die ich in den letzten Jahren angesammelt habe. Macht es Sinn, diese als Wortliste in ein neues Profil zu importieren, auch wenn keine Dokumente vorhanden sind mit deren Hilfe ich sie an meinen Schreibstil anpassen kann?

Frohe Ostern!

Hans

DPI 15 auf Windows 10 Professional (64-bit)
SpeechMike Premium. Intel i7 Core 4x2.67 GHz, 6 GB RAM

6

Re: Wie kann das Vokabular individuell optimal angepasst werden?

Lieber Herr Wilke,

vielen Dank für die Antwort – mein Fehler, ich hatte Ihre Anleitung nicht genau genug gelesen und übersehen, dass Sie am Ende empfehlen, die Schreibstil-Anpassung nicht – wie ich irrig gedacht hatte – anhand der Wortliste vorzunehmen, sondern anhand der Mustertexte. Also – alles gut.

Österliche Grüße, Marius Raabe

Dragon NaturallySpeaking 11.5 Legal
Windows 7 Prof. 64-Bit, Office 2010, Jarte Plus
Philips SpeechMike II Pro Plus, SpeechMike III, SpeechMike Air, PDCC 2.8
Intel Core2 Quad Q9550, 2,83 GHz, 2x6MB L-2, 8 GB RAM

7

Re: Wie kann das Vokabular individuell optimal angepasst werden?

Dioskur schrieb:
R.Wilke schrieb:

Die schärfste Waffe im Drachenkampf - genitivus subjectivus, wohlgemerkt - ist ein maßgeschneidertes Vokabular.

Hallo Rüdiger,

was ist mit meinen benutzerdefinierten Vokabeln, die ich in den letzten Jahren angesammelt habe. Macht es Sinn, diese als Wortliste in ein neues Profil zu importieren, auch wenn keine Dokumente vorhanden sind mit deren Hilfe ich sie an meinen Schreibstil anpassen kann?

Frohe Ostern!

Hans


Lieber Hans,

der größte Feind im Drachenkampf (Erkennung) ist die Mehrdeutigkeit, Eindeutigkeit aber der größte Segen. Es kann zwar helfen, Wortlisten oder komplette Konkordanzen, wie vom Vorredner beschrieben, zu importieren, außer in den Fällen, wo nur die Kenntnis der Kontexte darüber entscheidet, wenn zwei oder mehrere miteinander konkurrierende Lösungen im Raum stehen. Im übrigen, man kann ein Vokabular auch fehlerhaft aufbauen, nämlich genau dann, wenn Mehrdeutigkeit erzeugt wird (z.B. durch Doppelformen, Phrasen, "Workarounds" usw.), anstatt für Klarheit zu sorgen. Wenn dann noch fremdsprachige Wortformen dazu kommen - Wörter lat. oder gr. Ursprungs, aber auch Anglizismen -, sind die automatisch erzeugten Aussprachen in der Regel falsch, und die Wörter  müssen einzeln trainiert werden.

In Deinem Fall, da Du mir ja persönlich von Erkennungsproblemen berichtet hast, würde ich also mal explizit vorschlagen, das Vokabular von Grund auf neu aufzubauen.

Per astera ad astra.
Rüdiger

DPI 15.3 (15.30.000.006) auf Windows 8.1 (64-bit)
SpeechMike Premium (LFH3500) mit Philips Device Control Center (3.0)
Intel i7 2600 QuadCore - 3.4 GHz - 8 MB L3-Cache - 6 GB RAM

8

Re: Wie kann das Vokabular individuell optimal angepasst werden?

Hallo Rüdiger,

also beim besten Willen, den grundlegenden Neuaufbau muss ich mir erstmal überlegen. Die Griesbreimauer, durch die ich mich da hindurch essen müsste, um ins gelobte Drachen-Schlaraffenland zu kommen, ist doch recht dick, zumal ich Griesbrei überhaupt nicht mag. Und trotzdem kann dann noch ein orthographischer Dys-Astér wie in Deinem Fall am Drachenhimmel stehen, weil, wie du schreibst, der Drache mit untrainierten griechisch-lateinischen, also fremdsprachigen Wortformen Probleme hat.

Sei herzlich gegrüßt.

Hans

DPI 15 auf Windows 10 Professional (64-bit)
SpeechMike Premium. Intel i7 Core 4x2.67 GHz, 6 GB RAM

9

Re: Wie kann das Vokabular individuell optimal angepasst werden?

Lieber Hans,

to meson ariston. Wenn Du mit der Erkennungsgenauigkeit, die Dein Vokabular abliefert, zufrieden bist, besteht kein Handlungsbedarf. Wenn aber nicht, vielleicht doch. Es wäre dann zu klären, woran es liegt. Wissen ist besser als Meinen.

Sapere aude.
Rüdiger

DPI 15.3 (15.30.000.006) auf Windows 8.1 (64-bit)
SpeechMike Premium (LFH3500) mit Philips Device Control Center (3.0)
Intel i7 2600 QuadCore - 3.4 GHz - 8 MB L3-Cache - 6 GB RAM

10 Zuletzt bearbeitet von Dioskur (03.04.2010 16:35:10)

Re: Wie kann das Vokabular individuell optimal angepasst werden?

R.Wilke schrieb:

Lieber Hans,

to meson ariston. - Sapere aude.
Rüdiger

Okay, Rüdiger, wenn wir nun schon auf Griechisch und Latein kommunizieren, dann sage ich zu dem von uns diskutierten Thema suum cuique: Ich bin mit ca. 25 Dokumenten so vorgegangen, wie Du es hier empfiehlst und habe aus dem bisherigen Benutzer meine benutzerdefinierten Wörter hinzugefügt. Zur Zeit bin ich mit den Ergebnis recht zufrieden.

Salve

Hans

DPI 15 auf Windows 10 Professional (64-bit)
SpeechMike Premium. Intel i7 Core 4x2.67 GHz, 6 GB RAM

11

Re: Wie kann das Vokabular individuell optimal angepasst werden?

Komisch,
ich hab meine Konkordanzliste genommen und die unbekannten Wörter trainiert. Dann erkannte DRAGON auch so schoene Sachen wie Rhus toxicodendron, Lachesis, Equisetum hiemale usf.
Gruss Homoeopath

12

Re: Wie kann das Vokabular individuell optimal angepasst werden?

Nein, das ist nicht komisch, wenn die Wörter trainiert worden sind, werden sie auch anhand der dabei gewählten Aussprache erkannt.

Wenn nicht, sehen die automatisch unterlegten Aussprachen (nach den LTS-Regeln) in den seltensten Fällen so aus wie gewünscht, und je nachdem, wie groß die Abweichung ist, und gleichzeitig andere Kandidaten in Frage kommen, kann es vorkommen, dass die dann genommen werden.

Rüdiger Wilke

DPI 15.3 (15.30.000.006) auf Windows 8.1 (64-bit)
SpeechMike Premium (LFH3500) mit Philips Device Control Center (3.0)
Intel i7 2600 QuadCore - 3.4 GHz - 8 MB L3-Cache - 6 GB RAM

13

Re: Wie kann das Vokabular individuell optimal angepasst werden?

Lieber Herr Wilke,

vielen Dank für das informative Forum!

Beüzglich des Vokabulars stehe ich vor der Frage, ob ich bei einem Wort, das ich dem Vokabular hinzufüge auch die daraus abgeleiteten Wortformen -also Konjugationen oder Deklinationen- gesondert eingeben soll; anders gefragt: kann der Drachen aus der "Grundform" eines Wortes die flektierten Formen generieren?

14

Re: Wie kann das Vokabular individuell optimal angepasst werden?

... und noch eine weitere Frage: Setzt die bloße Anpassung an den Schreibstil - also ohne Hinzufügen neuer Worte - auch die gründliche Vorabpräparation der Texte (Zahlen, Abkürzungen u. Eigennamen entfernen + Abspeichern als Textdatei) voraus oder geht das in gleich effektiver Weise mit nicht präparierten Dokumenten?

Vielen Dank!

15

Re: Wie kann das Vokabular individuell optimal angepasst werden?

JoKa schrieb:

Lieber Herr Wilke,

vielen Dank für das informative Forum!

Beüzglich des Vokabulars stehe ich vor der Frage, ob ich bei einem Wort, das ich dem Vokabular hinzufüge auch die daraus abgeleiteten Wortformen -also Konjugationen oder Deklinationen- gesondert eingeben soll; anders gefragt: kann der Drachen aus der "Grundform" eines Wortes die flektierten Formen generieren?


Zur Entlastung von Herrn Wilke, dem wir alle zu Dank verpflichtet sind, antworte ich einfach mal: Nein, das kann der Drachen nicht, man muss alle flektierten Formen händisch eingeben – zuweilen zeigt sich dabei allerdings, dass diese im nicht aktiven Vokabular vorhanden waren (zu erkennen daran, dass hinterher im Vokabular vor dem Wort ein grünes Sternchen verzeichnet ist).

Grüße, Marius Raabe

Dragon NaturallySpeaking 11.5 Legal
Windows 7 Prof. 64-Bit, Office 2010, Jarte Plus
Philips SpeechMike II Pro Plus, SpeechMike III, SpeechMike Air, PDCC 2.8
Intel Core2 Quad Q9550, 2,83 GHz, 2x6MB L-2, 8 GB RAM

16

Re: Wie kann das Vokabular individuell optimal angepasst werden?

Hallo JoKa, und willkommen im Forum!

1.) Dragon hat "keine Ahnung" von Grammatik o.ä., und man muss (leider) alle flektierten Formen eines Wortes, so weit benötigt, einzeln eingeben.

2.) Ich würde zumindest die Mustertexte als Textdateien (TXT) speichern, wenn andere Formate eingelesen werden, können Fehlermeldungen folgen, so erst aktuell bei KnowBrainer berichtet. Ob sie bei "bloßer" Anpassung an den Schreibstil (ohne Suchen nach neuen Worten) auch "unbereinigt" in gleicher Weise unbedenklich verwendet werden können, würde ich bejahen, kann ich allerdings nicht mit letzter Sicherheit bestätigen. Aber, die Logik spricht dafür.

Viele Grüße
Rüdiger Wilke

DPI 15.3 (15.30.000.006) auf Windows 8.1 (64-bit)
SpeechMike Premium (LFH3500) mit Philips Device Control Center (3.0)
Intel i7 2600 QuadCore - 3.4 GHz - 8 MB L3-Cache - 6 GB RAM

17

Re: Wie kann das Vokabular individuell optimal angepasst werden?

Marius Raabe schrieb:

Zur Entlastung von Herrn Wilke, dem wir alle zu Dank verpflichtet sind, antworte ich einfach mal: ...
Grüße, Marius Raabe

Sehr schön! Und Danke dafür.

RW

DPI 15.3 (15.30.000.006) auf Windows 8.1 (64-bit)
SpeechMike Premium (LFH3500) mit Philips Device Control Center (3.0)
Intel i7 2600 QuadCore - 3.4 GHz - 8 MB L3-Cache - 6 GB RAM

18

Re: Wie kann das Vokabular individuell optimal angepasst werden?

Hallo zusammen,


ich habe eine Frage zum Dragon-Vokabular, auf welche ich auch im Forum bisher keine Antwort gefunden habe.

Ich verwende "Dragon Naturally Speaking Professional" in der Version 9.5 und habe Probleme mit der Anpassung meines Benutzervokabulars.

Ich habe in meinem Benutzervokabular zahlreiche "Begrifffolgen" mit anderslautender gesprochener Form angelegt.
Beispielsweise: "Forum zu DNS" mit der gesprochenen Form "Forum text"
Wenn ich dem Vokabular eine Liste mit Wörtern hinzufügen möchte funktioniert das nicht zu meiner Zufriedenheit. Die Worte die bereits im Vokabular vorhanden sind und die ich abändern möchte, liegen nach dem Importieren doppelt vor und ich müsste die "alten" Einträge von Hand löschen.
Gibt es eine Funktion zum "Updaten" des Benutzervokabulars?


Ich denke, dass dies nicht Sinn der Sache sein kann und dass andere Benutzer sicher vor ähnlichen Problemen stehen.


Ich hoffe, dass mein Anliegen verständlich ist und freue mich auf Antworten!

Gruß
DragonUser

DNS 14 Legal - DNS MedicalPE 13 - Win7/64 - Intel Core i5 @ 2,4GHz - 4 GB RAM

19

Re: Wie kann das Vokabular individuell optimal angepasst werden?

Hallo DragonUser,
mir scheint, hier liegt ein Verständnisproblem vor: die Wörter im Dragon-Vokabular unterscheiden sich anhand der gesprochenen Form (wenn die nicht explizit angegeben wurde, ist  geschriebene Form zugleich auch die gesprochene) und nicht der geschriebenen. Deshalb kann man dieselbe geschriebene Form für unterschiedliche gesprochene Formen angeben, was ja durchaus sinnvoll ist.
Die von Ihnen hinzugefügten Wörter können also nicht als "Korrektur" vorhandener betrachtet werden, sondern sind eben neue Wörter. (Korrigieren könnte man allenfalls eine geschriebene Form, die zu einer gesprochenen Form gehört. ) Die "alten" Einträge müssen per Hand gelöscht werden. 

Eine Funktion zum "Updaten" des Benutzervokabulars gibt es nicht. Denkbar (und wünschenswert) wäre eine Textdatei-gesteuerte Löschfunktion, wie sie anno dunnemals Dragon Dictate hatte. Dabei konnte den Wörtern der Liste noch ein Parameter "/add" bzw. "/del" beigefügt werden.

Gruß
Hermann Meltzer

20

Re: Wie kann das Vokabular individuell optimal angepasst werden?

Hallo Dragon-User, und willkommen im Forum!

Nur zur Ergänzung zu Hermann Meltzers Tipp: man könnte auch ein Skript schreiben, das eine Wortliste in der Weise abarbeitet, dass die darin gelisteten Wörter aus dem Vokabular gelöscht werden. Aber, erstens ist das Trickserei, und zweitens verstehe ich den Sinn noch nicht so ganz, und hätte gerne an ein oder zwei Beispielen erklärt, worum es genau geht.

Wären Sie so freundlich, mir weiter zu helfen?

Grüße
Rüdiger Wilke

PS: Alle Fragen rund ums Vokabular werden in der nächsten Folge der "Grundlagen" behandelt. Bleiben Sie dran!

DPI 15.3 (15.30.000.006) auf Windows 8.1 (64-bit)
SpeechMike Premium (LFH3500) mit Philips Device Control Center (3.0)
Intel i7 2600 QuadCore - 3.4 GHz - 8 MB L3-Cache - 6 GB RAM

21

Re: Wie kann das Vokabular individuell optimal angepasst werden?

Lieber Herr Meltzer,
lieber Herr Wilke,

erst einmal vielen Dank für Ihre Antworten!


Es könnte durchaus sein, dass es bei mir da ein bißchen am Verständnis mangelt.

Dass ich für eine geschriebene Form unterschiedliche Sprechweisen anlegen kann, leuchtet mir ein.
Die Tatsache, dass bei einer Änderung der geschriebenen Form ein zweiter Eintrag mit gleicher Sprechweise im Vokabular angelegt wird und ich den "alten" Eintrag manuell entfernen muss, ist mir aber nicht begreiflich.

Im konkreten Fall ist es so, dass ich ca. 150 Einträge in meinem Vokabular anpassen möchte. Statt mit einem Großbuchstaben sollen die Einträge nun klein beginnen.
Ich bin so vorgegangen, dass ich mein Vokabular exportiert habe, die betreffenden Einträge abgeändert habe und das Vokabular danach wieder einlesen wollte.
Dabei wurden die neuen Einträge erkannt und auch in das Wörterbuch übernommen. Es war jedoch auch so, dass die "alten" Einträge mit derselben "Sprechform" nicht überschrieben wurden, sondern der Eintrag fortan doppelt im Vokabular zu finden war.
Ich fand keine andere Lösung als die "alten" Einträge von Hand zu entfernen, was ich als sehr lästig empfand.

Mir ist auch aufgefallen, dass bei einer Änderung an der Schriftform eines benutzerdefinierten Eintrages direkt im Vokabular das gleiche Problem auftrat.
(Bsp.: Schriftform --> "Forum für DNS" ; gesprochene Form --> "Forum text"     
Bei einer Änderung von "Forum für DNS" in "forum für DNS" bei gleicher Sprechweise wird der "alte" für mich nun falsche Eintrag nicht gelöscht, sondern ich muss dies manuell erledigen)


Ich bin gespannt auf Ihre Antworten.

Gruß
DragonUser

DNS 14 Legal - DNS MedicalPE 13 - Win7/64 - Intel Core i5 @ 2,4GHz - 4 GB RAM

22

Re: Wie kann das Vokabular individuell optimal angepasst werden?

Lieber Dragon-User,

um den aus meiner Sicht richtigen Ausführungen von Vincent alias Herrn Meltzer etwas eigenen „Senf“ hinzuzufügen:

In der Regel ist es unproblematisch, wenn eine geschriebene Form mit mehreren gesprochenen Formen hinterlegt ist.

Das kann sogar sinnvoll sein, wenn das Programm mit der einen oder anderen gesprochenen Form (insbesondere bei Abkürzungen) Schwierigkeiten hat oder man sich einfach mehrere Alternativen für das Diktat offen halten will. So ist bei mir die Abkürzung „DVBl.“ (für „Deutsches Verwaltungsblatt“) sowohl mit der gesprochenen Form "DV Blatt" als auch "D. V. B. L." (zur Sicherheit auch noch "de vau be el") und "deutsches Verwaltungsblatt" hinterlegt – insbesondere die ersten beiden gesprochenen Formen sind bei Juristen etwa gleich weit verbreitet.
Langfristig ist zu empfehlen, möglichst intuitiv diktieren zu können, das scheint mir bei starken Abweichungen zwischen der gesprochenen Form und der geschriebenen bei normalem Text eher nicht der Fall zu sein (wie in Ihrem Beispiel). Daher sollte man meines Erachtens Wörter mit abweichenden gesprochenen Formen auf Sonderfälle wie Abkürzungen, Zahlwörter, Fremdwörter und dergleichen beschränken, zumal ich die Vermutung hege, dass man durch den häufigen Gebrauch solcher Abweichungen den Drachen eher verwirrt (beim Lernen behindert).

Problematisch kann die Vorgehensweise werden – und vielleicht ist dies die Konstellation, die Sie meinen –, wenn ein und dieselbe gesprochene Form einmal als geschriebene Form vorhanden ist (genauer: als ein Wort mit identischer geschriebener und gesprochener Form) und einmal als gesprochene Form mit abweichender geschriebener Form, wenn also zwei identische gesprochene Formen um die richtige Schreibweise konkurrieren. Beispiel: Man hat das Wort "Paragraph" als Wort mit identischer gesprochener und geschriebener Form im Vokabular, fügt es aber auch noch mit der gesprochenen Form "Paragraph" und der geschriebenen "§" hinzu. Anderes Beispiel: Ich habe den "Gedankenstrich" mit einer geschriebenen Form belegt, um ihn typographisch korrekt länger als den Bindestrich darzustellen ("Halbgeviertstricht"), im Vokabular ist er aber auch in der kurzen Variante vorhanden (hier hilft übrigens selbst das Löschen nur vorübergehend).
In all diesen Fällen kann es zu unerwünschten Erkennungen kommen.

Besser fährt man hier – und so ist es eigentlich vom Hersteller wohl auch beabsichtigt –, wenn man nicht mit unterschiedlichen gesprochenen und geschriebenen Formen arbeitet, sondern unter den „Worteigenschaften“ im Vokabular eine alternative Schreibweise definiert. Je nachdem, ob man zusätzlich zu der Definition auch noch das entsprechende Häkchen aktiviert oder anschließend wieder deaktiviert, wird die Schreibweise priorisiert.


Was die Verhinderung unerwünschter Vokabeln bei der Erweiterung des Vokabulars angeht, hat man, wenn man die Funktion „Wörter aus Dokumenten hinzufügen“ (auch mit einer Wortliste) benutzt, immerhin die Möglichkeit, im Einzelnen anzuklicken, welches Wort hinzugesetzt wird oder nicht – noch einfacher ist es natürlich, die Wortliste gleich um die unerwünschten Vokabeln zu kürzen. Aber was Ihnen mit dem "Updaten" vorschwebte, war vermutlich auch eher eine Zusammenführung und Bereinigung um doppelte geschriebene Ausdrücke. Aus den genannten Gründen ist eine solche Funktion nicht vorgesehen und m. E. auch nicht sehr wichtig.

Wichtiger als die von Herrn Meltzer vermisste Löschfunktion wäre m. E., wenn das Programm standardmäßig zulassen würde, am Ende einer jeden Sitzung anhand einer Liste zu entscheiden, ob zunächst temporär hinzu gelernte Wörter dauerhaft ins Vokabular aufgenommen werden. Ich glaube, es gibt Zusatzsoftware, welche diese Funktionalität bereitstellt, aber es müsste eigentlich simpel sein, dies für alle Benutzer des Programms herstellerseitig zu integrieren.


Wir sind jetzt alle gespannt auf ein paar Beispiele von Ihnen!

Viele Grüße, Marius Raabe

Dragon NaturallySpeaking 11.5 Legal
Windows 7 Prof. 64-Bit, Office 2010, Jarte Plus
Philips SpeechMike II Pro Plus, SpeechMike III, SpeechMike Air, PDCC 2.8
Intel Core2 Quad Q9550, 2,83 GHz, 2x6MB L-2, 8 GB RAM

23

Re: Wie kann das Vokabular individuell optimal angepasst werden?

Ooops, da hat sich mein Diktat mit Ihrer Antwort überschnitten - ich sehe mich halb bestätigt, dass Ihr Problem darin liegt, dass aufgrund Ihres Vorgehens im Ergebnis gleiche gesprochene Formen verschiedene Schreibweisen haben. Versuchen Sie es mal mit den Worteigenschaften, und die Sache ist behoben.

Grüße nochmals, M. Raabe

Dragon NaturallySpeaking 11.5 Legal
Windows 7 Prof. 64-Bit, Office 2010, Jarte Plus
Philips SpeechMike II Pro Plus, SpeechMike III, SpeechMike Air, PDCC 2.8
Intel Core2 Quad Q9550, 2,83 GHz, 2x6MB L-2, 8 GB RAM

24

Re: Wie kann das Vokabular individuell optimal angepasst werden?

Guten Abend Herr Rabe,

also im Endeffekt geht es mir darum Einträge im Vokabular, bei Beibehaltung der Sprechweise, zu ändern.

Die "alte" (nicht mehr benötigte) Schriftform soll es dann im Vokabular nicht mehr geben und ich möchte sie nicht manuell löschen müssen.

Ich werde mich einmal an den Worteigenschaften versuchen und Ihnen von meinen Erfolgen berichten.


Grüße
DragonUser

DNS 14 Legal - DNS MedicalPE 13 - Win7/64 - Intel Core i5 @ 2,4GHz - 4 GB RAM

25

Re: Wie kann das Vokabular individuell optimal angepasst werden?

Guten Abend allerseits,

ich versuche mal, die Diskussion, so weit ich sie verstanden habe, zusammen zu fassen:

1. Niemals zwei mal die selbe gesprochene Form einfügen. Dragon "hört" und erkennt immer gesprochene Formen, und ordnet die geschriebenen Formen nach. Wenn dieselbe gesprochene Form zwei mal vorhanden ist, weiß Dragon nicht, welche gemeint ist.

Das selbe Problem ergibt sich - kann sich dann ergeben, und es geschieht, wenn komplette Phrasen eingegeben werden, wo die einzelnen Bestandteile auch als Einzelwörter existieren. Was hört Dragon dann, die Phrase, oder die Wörter?


2. Umgekehrt aber können einer geschriebenen Form unterschiedliche gesprochene Form zu Grunde liegen, das ergibt sich daraus.

3. Wenn eine gesprochene Form unterschiedlich umgesetzt werden soll, je nach Kontext, geht das am besten über die Worteigenschafte, wo alternative Schreibweisen definiert werden können, die wiederum an Bedingungen geknüpft sein können, etwa vor oder nach Zahlen. Dann sind sie Verhältnisse eindeutig.

4. Wenn bei einem Wort die vorgegebene Groß- oder Kleinschreibung geändert werden soll - Beispiele? -, geht das am besten mittels Definition als alternativer Schreibweise.

5. Wörter aus dem Vokabular zu löschen ist so überflüssig wie ein Geschwür am Hals.

6. Aus den oben nieder gemeißelten, ehernen Grundsätzen, folgt - in Ergänzung zu Herrn Raabes, nicht ganz originärer Idee, die während der Sitzung neu hinzugekommenen Wörter am Ende zur Disposition zu stellen - eigentlich, dass der Hersteller besser dafür sorgen sollte, dass ein und die selbe gesprochene Form kein zweites Mal eingegeben werden kann - auch nicht stückweise -, wo doch momentan dieses Prinzip nur bei den geschriebenen Formen greift, zumindest so lange, wie keine gesprochenen Formen beigegeben werden.

Viel Erfolg!
Rüdiger Wilke

DPI 15.3 (15.30.000.006) auf Windows 8.1 (64-bit)
SpeechMike Premium (LFH3500) mit Philips Device Control Center (3.0)
Intel i7 2600 QuadCore - 3.4 GHz - 8 MB L3-Cache - 6 GB RAM