Frage zu:"Wie kann das Vokabular individuell optimal angepasst werden?"
Hallo allerseits,
ich bin ganz neu in dem Forum und seit letzter Woche stolzer Besitzer einer DNS Premium 12.5 Vers.. Da ich nunmehr mein Vokabular so aufbauen möchte, wie von Herrn Wilke schon vor langer Zeit erklärt (am 02.04.2010 00:31:37; s.o. Beitrag 1.)) besteht für mich die Frage wie die "einzulesenden Grunddokumente" aus dem eigenen Fachvokabular ausgeschrieben sein müssen. Herr Wilke schrieb damals:
...."Die Texte sind daher grundsätzlich Wort für Wort durchzuarbeiten und nach den o.g. Kriterien umzuarbeiten, indem (a) lediglich die reinen Textkörper verwendet werden, Briefköpfe, Betreffs o.ä. dagegen gleich heraus genommen werden; (b) im Textkörper irrelevante Eigennamen durch "Müller" oder geläufige Kontaktpersonen ersetzt werden; (c) Zahlen entweder durch Wörter ersetzt oder die Texte entsprechend umformuliert werden, jedoch ohne den Satzbau zu zerstören; (d) Abkürzungen entweder ersetzt oder in gesprochene Formen umgewandelt werden, z.B. "1. Etage" in "erste Etage"; und (e) sämtliche Orthographie- und sonstigen Tippfehler ausgemerzt werden, denn würde z.B. nach einem Satzzeichen die Leerstelle fehlen, würde das Wort davor, das Satzzeichen und das darauf folgende Wort in zusammenhängender Einheit als "neues Wort" identifiziert".....
Folgend Fragen daher: 1. Muss ich daher auch den reinen Text in ausgeschriebener Form wie folgt (Satzzeichen usw.) beispielsweise:
Punkt für . Komma für , Semikolon für ; Doppelpunkt für : Klammer auf für ( Anführungszeichen für " Paragraphzeichen für §
etc., etc ........., konvertieren?
2. Wie muss ein solcher Text - zwecks guter Vorbereitung für das Arbeiten mit Dragon - (genauer) aussehen? Kann jemand mal einen kurzen Dreizeiler als Beispieltext zeigen?
Zitat von BodmanMuss ich daher auch den reinen Text in ausgeschriebener Form wie folgt (Satzzeichen usw.) beispielsweise:
Satzzeichen und sonstige Symbole, die schon im Vokabular sind (als geschriebene Formen), etwa "§", können bleiben wie sie sind. Auf jeden Fall raus müssen Ziffern. Grundsätzlich gilt die Frage: was soll Dragon aus der Text-Analyse lernen? Ein Beispiel aus meiner Praxis.
In meinen Berichten muss ich die Adressen der von mir besichtigten Objekte und die Namen der Anwesenden wiedergeben. Die Namen der Straßen und Orte können es wert sein, hinzugefügt zu werden, wenn ich sie öfter benötige. Dasselbe gilt für die Namen der Personen. Die Hausnummern und die Postleitzahlen zu belassen macht gar keinen Sinn, ist sogar kontraproduktiv, denn dann werden sie als geschriebene Formen hinzugefügt.
ZitatWie muss ein solcher Text - zwecks guter Vorbereitung für das Arbeiten mit Dragon - (genauer) aussehen? Kann jemand mal einen kurzen Dreizeiler als Beispieltext zeigen?
Machen wir es doch umgekehrt, Sie zeigen uns einen Textausschnitt, und wir die Umarbeitung.
Gruß, RW
_______________________________________
Dragon Professional 16 auf Windows 10 Pro und Windows 11 SpeechMike Premium (LFH3500); Office 2019 Pro + Office 365 (monatliches Abo) HP ZBook Fury 17 G8 - i7-11800H - 24 MB SmartCache - 32 GB RAM - 1 TB SSD
vielen Dank für die prompte Antwort. Ich muss schon sagen (oder besser schreiben): "Respekt", was sie hier leisten, ist großartig. Da die Dokumentation von DNS m.E. erheblich zu wünschen übrig läßt, bin ich sehr froh, dass es das von ihnen betreute Forum gibt. Nun zu meinem (annonymisierten) Textbeispiel:
".... 4. Im Rahmen der Abwägung der wechselseitigen Verursachungs- und Verschuldensanteile der Unfallbeteiligten hält die Kammer eine Haftungsverteilung von 2/3 zu 1/3 zu Lasten der Beklagten für angemessen (vgl. hierzu auch OLG Hamm, OLG-Report 1993, 19; Kammer, Urteil vom 09.04.2010 – 13 S 244/09). Vorliegend hat der Erstbeklagte der ihm nach § 9 Abs. 5 StVO obliegenden, gesteigerten Sorgfaltspflicht des in ein Grundstück Abbiegenden nicht genügt. Ein Verstoß gegen diese höchstmögliche Sorgfalt begründet regelmäßig die Alleinhaftung des Abbiegenden, wenn er dem anderen einen Fahrfehler nicht nachweisen kann (vgl. nur KG, NZV 2007, 408; OLG Düsseldorf, NZV 2006, 415; OLG München, Urteil vom 29.10.2010 – 10 U 2996/10, juris; Kammer, st. Rspr., zuletzt Urteil vom 05.04.2012 - 13 S 17/12; Hentschel aaO § 9 StVO Rn. 52 m.w.N.). ..."
MfG
Bodman
P.S.: Ich gehe davon aus, dass ich mit dem obigen Auszug kein Copyright verletze, da die Entscheidung frei im Internet über "http://www.verkehrslexikon.de/Texte/Rspr5008.php" verfügbar ist. Fall dies dennoch der Fall wäre, so habe ich dies nicht beabsichtigt und sage hiermit bereits vorab zu, in Zukunft eine Wiedergabe des Textes oder einen in dem Sinne vergleichbaren nicht mehr im Internet wieder zugeben.
Keine Ursache. Bei dem Beispieltext halte ich mich lieber erst einmal zurück, weil ich nicht weiß, wie einige der Abkürzungen im Regelfall ausgesprochen werden, bzw. ob und wie sie schon im Vokabular erfasst sind. Da wäre es besser, wenn einer der Fachkundigen sich dazu äußern würde.
Gruß, RW
_______________________________________
Dragon Professional 16 auf Windows 10 Pro und Windows 11 SpeechMike Premium (LFH3500); Office 2019 Pro + Office 365 (monatliches Abo) HP ZBook Fury 17 G8 - i7-11800H - 24 MB SmartCache - 32 GB RAM - 1 TB SSD
nun ich weiss, das der Text etwas gemein ist. Damit vielleicht keinem Anderen zu viel Arbeit abverlangt wird, berichtige ich den Text selbst und sie teien mir mit, ob das so in Ordung ginge?
Mein Vorschlag:
".... viertens im Rahmen der Abwägung der wechselseitigen Verursachungs- und Verschuldensanteile der Unfallbeteiligten hält die Kammer eine Haftungsverteilung von zwei Dritteln zu einem Drittel zu Lasten der Beklagten für angemessen (vergleiche hierzu auch OLG Hamm, OLG-Report neunzehnhundert dreiundneunzig, neunzehn; Kammer, Urteil vom neunten vierten zweitausenzehn – dreizehn aus null neun). Vorliegend hat der Erstbeklagte der ihm nach § neun Absatz fünf StVO obliegenden, gesteigerten Sorgfaltspflicht des in ein Grundstück Abbiegenden nicht genügt. Ein Verstoß gegen diese höchstmögliche Sorgfalt begründet regelmäßig die Alleinhaftung des Abbiegenden, wenn er dem anderen einen Fahrfehler nicht nachweisen kann. ..."
Den Rest habe ich rausgenommen, weil wohl für Dragon überflüssig (?).
Genau so würde ich es machen, aber noch ein paar Anmerkungen dazu. Bei den folgenden Wortformen oder Phrasen sollten Sie dafür sorgen, dass sie im Vokabular in der Kombination "geschriebene Form - gesprochene Form" wie folgt vorhanden sind:
1/3 - ein Drittel 2/3 - zwei Drittel 2/3 - zwei Dritteln Verursachungs- und Verschuldensanteile - Verursachungs und Verschuldensanteile
Ansonsten wäre der Text für die Analyse so weit in Ordnung, sofern "OLG-Report" und "StVO" im Vokabular vorhanden sind.
Was Sie heraus genommen haben, hauptsächlich Abkürzungen, müssen Sie selbstverständlich auch irgendwie diktieren, und sofern Sie das mittels Eingaben und Einstellungen im Vokabular geordnet haben, werden Sie damit zurecht kommen. Für die Textanalyse, also den Lerneffekt, ist das aber, wie Sie schon selbst gesagt haben, irrelevant.
Gruß, RW
_______________________________________
Dragon Professional 16 auf Windows 10 Pro und Windows 11 SpeechMike Premium (LFH3500); Office 2019 Pro + Office 365 (monatliches Abo) HP ZBook Fury 17 G8 - i7-11800H - 24 MB SmartCache - 32 GB RAM - 1 TB SSD
Ich bin eigentlich nur auf den Artikel bei der Durchsicht der neuen Beiträge im Forum gestoßen und das Thema ist ja schon 2010 geschrieben worden.
Ich persönlich bin inzwischen zur Ansicht gelangt, dass zumindest mit DNS 12.0 bzw. 12.5 der Aufwand für Anpassungen des Vokabulars sehr gesunken ist. Ich gebe unumwunden zu, dass ich bei der Erstellung eines Benutzerprofils den anfänglichen Trainingstext durchlese und dann relativ konsequent meine diktierten Texte korrigiere. Das ergibt nach ein bis zwei Wochen eine Wortfülle, die alles, was ich brauche, abdeckt. Vielleicht habe ich ja selbst einen viel zu geringen Wortschatz gegenüber allen anderen Diktanten, aber als ich vor längerer Zeit probeweise einen erheblichen Aufwand getrieben habe, war das Ergebnis eigentlich auch nicht besser.
Wie sieht die Meinung dazu heute aus, fast 3 Jahre später, nachdem Herr Wilke das Thema hier begonnen hatte?
Gruß
A. Wagner
[Dragon Legal Anywhere mit SpeechMIke LFH 3510, Intel(R) Core(TM)I7-7500 CPU, 16 GB RAM, Windows 10 Pro. 64 Bit [/i]
Was Lupus an dem Beitrag gefällt, ist die zum Ausdruck kommende gelassene Geisteshaltung (oder soll man sagen: Drachen-Ergebenheit). In der Tat gilt das Gesetz vom abnehmenden Grenznutzen auch für die Profilanpassung.
Gleichwohl glaubt Lupus, dass sowohl das anfängliche Hinzufügen der benutzerdefinierten Wörter aus dem vorherigen Profil (in Lupus' Fall sind das so um die 28.000) als auch eine Anpassung an den Schreibstil (aber ohne Aufnahme neuer Wörter), also die Anlage des Benutzer-Sprachmodells, lohnenswert sind.
Wie sehr, das hängt von der Art der Texte ab, die man diktiert, und nicht zuletzt davon, wie nah man dem Idealfall des gleichförmigen und deutlichen Diktats – wie ein Nachrichtensprecher – kommt. Von der Art der diktierten Texte hängt natürlich ab, wie viele benutzerdefinierte Wörter man benötigt. Auch ein noch so gut diktiertes Wort kann nicht erkannt werden, wenn es nicht im aktiven Vokabular ist. Für bekannte Wörter gilt: Je besser der akustische Input, desto weniger kommt es auf ein gut angepasstes Sprachmodell an, meint
Ich frage mich gerade, ob mit dieser Methode auch die Wörter erfasst werden, die letztendlich (neu) im Lexikon landen. Wenn man das benutzerdefinierte Vokabular als TXT-Liste exportiert, sind die Einträge im Lexikon ja leider nicht mit enthalten. Vielleicht werden sie durch die anschließende reine Analyse der Dokumente mit aktiviert (?) Falls das nicht der Fall sein sollte, würde ich nach einer Methode suchen, irgendwie an diese Wörter in Form einer Liste heranzukommen, zumindest auf indirektem Weg. Direkt scheint es ja nicht möglich zu sein. Ist es denn eigentlich möglich, direkt nach der Erweiterung des Vokabulars ddurch „Lernen von bestimmten Dokumenten“ die soeben neu hinzugefügten Wörter irgendwie zu einer TXT-Liste zu machen? Ich habe es versucht aber leider keine Möglichkeit gefunden.
Grüße an alle Drachennutzer, Christiane
Dragon Professional Individual 15.3 Firefox 60.0.1 (32-Bit) / Google Chrome 71.0.3578.98 (64 Bit) Microsoft Office 365 Windows 7 (64 Bit)
Und was ist überhaupt mit den "Wörtern aus dem Lexikon"? Die spielen bei mir zumindest eine nicht unerhebliche Rolle. Zu deren Export kann ich ein Skript zur Verfügung stellen, mit dem man sie - wenn auch etwas umständlich - heraus holen kann. Geht aber bekanntlich nur in Pro.
Mittels Suchfunktion ist mir nun klar geworden, dass durch die Dokumentanalyse die Wörter aus dem Lexikon wohl mit aktiviert werden. Trotzdem wäre das für mich keine sehr glückliche Lösung, weil die Dokumente, aus denen ich mein Vokabular für die Uni extrahiere, einiges an Fehlern und Schrottvokabular enthalten, in allererster Linie durch die Konvertierung von PDF oder PowerPoint zu TXT. Aus den Wortlisten nach der Dokumentenanalyse ist dieser Schrott schnell und leicht zu entfernen, jedoch die Originaldokumente Wort für Wort zu korrigieren wäre extrem mühsam. Und unkorrigierten und fehlerhaften Schrott ffür die Dokumentenanalyse zu nutzen wäre wohl auch nicht so klug.
Viele Grüße, Christiane
Dragon Professional Individual 15.3 Firefox 60.0.1 (32-Bit) / Google Chrome 71.0.3578.98 (64 Bit) Microsoft Office 365 Windows 7 (64 Bit)
Zitat von ChristianeTrotzdem wäre das für mich keine sehr glückliche Lösung, weil die Dokumente, aus denen ich mein Vokabular für die Uni extrahiere, einiges an Fehlern und Schrottvokabular enthalten,
Die Funktion heißt nun mal "Aus vorhandenen Dokumenten lernen" - was unterstellt, dass dem Programm korrektes Lernmaterial vorgesetzt wird. Wenn statt dessen dem Lernprozess Schrott untergeschoben wird, landet der folgerichtig als Schrott im Vokabular und steht dort als benutzerdefinierte Wörter, gekennzeichnet mit rotem Pluszeichen. Entweder man merzt die Fehler im Originaldokument aus oder korrigiert während der Analyse - ein entsprechender Bearbeitungsschritt ist eingebaut.
Wenn bei der Dokumentenanalyse Wörter gefunden werden, die nur im Hintergrundwörterbuch (Lexikon) vorhanden sind, dann werden diese in das aktive Vokabular übernommen. In der Anzeige im Vokabulareditor sind diese Wörter mit grünem Pfeil gekennzeichnet. Diese Wörter sollten(!) korrekt sein; von Ausnahmen, die Nuance zu verantworten hat, mal abgesehen.
Nebenbei bemerkt: Wenn sich Lernmaterial durch mangelnde orthografische Sorgfalt auszeichnet, würde ich auch dem Inhalt nicht so recht trauen. Gruß, Pascal
Vielen Dank für die Antwort! Ich habe mich glaube ich ein wenig unklar bzw. unbedacht ausgedrückt, weswegen ich meinen Beitrag noch mal korrigiert habe. Der allergrößte Anteil an Fehlern in meinen Dokumenten kommt durch die nötige Konvertierung zustande, zum Beispiel werden immer mal wieder Wörter zusammengezogen und tauchen dann als ein Wort auf. Je nach Quelle kommen dann noch andere Fehler (bedingt durch den Verfasser) hinzu oder auch nicht, aber diese halten sich doch sehr stark in Grenzen uund würden auch kein Problem darstellen. Ich werde es jetzt so machen, dass ich diese Dokumente in ein Profil einspeise und dann die daraus entstandene TXT-Liste benutzerdefinierten Vokabulars sorgfältig korrigiere. Diese Liste wird dann verwendet, um mein eigentliches Profil zu erweitern, sodass in mein Benutzerprofil, welches ich zum Diktieren nutze, kein Schrott eingespeist wird. (Für die Dokumentenanalyse nutze ich seit längerer Zeit (unter anderem) von mir selbst erstellte Zusammenfassungen, diese existieren zum jeweiligen Thema aber noch nicht, wenn ich mein Vokabular erweitere) Die externen Quellen nach der Konvertierung in eine TXT Datei korrigieren zu müssen, würde mich sehr viel Zeit kosten, außerdem wären sie, da sie häufig Listen, Stichpunkte etc. enthalten, für eine Dokumentenanalyse ohnehin nicht sehr gut geeignet. Aus diesem Grund würde mir ein Skript sehr weiterhelfen, welches die im Lexikon enthaltenen Wörter eines Profils in eine TXT-Datei konvertiert. (Denn diese Wörter würden mir sonst auf diese Weise verloren gehen, da sie nicht in der Liste enthalten sind.) Und ich hatte es so verstanden, dass ein solches Skript möglicherweise bereits existiert oder in Arbeit ist (?).
Viele Grüße, Christiane
Dragon Professional Individual 15.3 Firefox 60.0.1 (32-Bit) / Google Chrome 71.0.3578.98 (64 Bit) Microsoft Office 365 Windows 7 (64 Bit)
Zitat von ChristianeUnd ich hatte es so verstanden, dass ein solches Skript möglicherweise bereits existiert oder in Arbeit ist (?).
Das Skript existiert nicht mehr, es hat sich als zu unzuverlässig erwiesen. Es gibt keine Möglichkeit, die Wörter aus dem Lexikon aus dem Profil zu extrahieren.
_______________________________________
Dragon Professional 16 auf Windows 10 Pro und Windows 11 SpeechMike Premium (LFH3500); Office 2019 Pro + Office 365 (monatliches Abo) HP ZBook Fury 17 G8 - i7-11800H - 24 MB SmartCache - 32 GB RAM - 1 TB SSD