Aragon, ich verstehe zwar nicht genau, warum Sie gerade Kunstwörter verwenden und diese umständlich über Word einlesen, statt einfach den Vokabulareditor zu benutzen (sagen Sie einfach mal „Vokabular bearbeiten“). Aber wie dem auch sei, solche Spiele spiele ich gerne mit, ich habe mal die Wörter „Potz“, „Flupp“ und „Ketelhut“ sowie „schwuppdiwupp“ genommen. Eine ungewollte Kompositabildung tritt beim Diktat dieser Wörter in 12.5 nicht auf.
In früheren Versionen, in denen es die aggressive Kompositabildung schon mal gab, war sie meines Erachtens wie gesagt auch nicht auf benutzerdefinierte Wörter beschränkt – obwohl es natürlich eine gewisse Plausibilität hätte, dass die Algorithmen, welche die Wahrscheinlichkeit einer Zusammenziehung beurteilen, bei neu hinzugefügten Wörtern leichter versagen. Bei den im Standardvokabular vorhandenen Wörtern sind nach meiner Erinnerung Bindungseigenschaften versteckt hinterlegt.
Den Ausführungen von Aragon und der Nuance-Hotline kann ich ganz und gar nur folgen. Bei mir tritt die unerwünschte Kompositabildung bei meinem nachträglich hinzugefügten Vokabular auf, insbesondere bei Eigennamen - ich diktiere viele Anschreiben/ E-Mails. So werden beispielsweise Vor- und Zunamen häufig zusammengeschrieben – der Befehl „Trenne das“ schafft in diesem Fall keine Abhilfe. Selbst mehrmaliges Trainieren der Wörter sowie wiederholte Korrekturen bringen keinen Erfolg. Ich löse das Problem mittlerweile, indem ich eine deutliche Pause zwischen den Wörtern einlege.
Dieses Manko trübt meines Erachtens meinen ersten guten Eindruck von der bislang (gefühlt) flotter laufenden Version 13 (im Vergleich zu DNS 12.5).
Oje. Da kann man nur alle Betroffenen herzlich bitten, das Problem jeweils individuell bei Nuance zu Gehör zu bringen. Vielleicht wird es dann ja doch noch (irgendwann) etwas mit einem Patch.
@Marcel Ja - mit Kunstpausen geht's zwar, das hat dann aber nichts mehr mit den Vorzügen von DNS 13 zu tun, dann kann ich wie bisher auch weiter tippen.
@Meinhard
Mit Spielchen hat das nichts zu tun. Dieser Beitrag hat mich doch stutzig gemacht. Wenn so viele Vokabeln eingelesen werden und der Nutzer keine Beanstandungen hat, dann mußte ich zumindest in Erwägung ziehen, daß diese Vorgehensweise ein anderes Ergebnis bringen könnte, auch wenn´s nicht logisch erscheinen mag. Laut der Hotline gehört Deutsch zu den prroblematischen Sprachen in Sachen Komposita. Was mir absolut nicht rund ist, wieso nach 12 vorherigen Versionen eine Verschlimmbesserung erfolgt und der Kunde wieder mal zum Beta Tester wird. Vielleicht ist das auch dem Fixtermin August geschuldet. Ebenso ist es mir unverständlich, warum ein Hersteller vorsätzlich mit einem Billig-Headset immer noch ein ansonsten tolles Produkt ausbremst in der Premium-Box-Version. Vergleichbar mit einem Sportwagenhersteller, der die billigst verfügbaren Reifen montiert........... das macht aber keiner - na ja - anderes Thema......
DNS 13 Premium mit Mikrofon Voicerecorder Zoom H1 / CPU: AMD FX-6100 mit 8 MB Cache / 8 GB Ram / Windows 7 Professional 64 Bit
Der Bericht von Aragon hat mich nun dazu bewogen, ebenfalls eine E-Mail an den Support von Nuance zu richten. Die E-Mail habe ich versendet, die Dateien (wie von Aragon beschrieben) habe ich noch nicht mitgeschickt. Ich möchte sie gern nachreichen. Meine Frage lautet daher: Wie kann ich diese Dateien generieren bzw. unter welchem Pfad finde ich sie?
Zitat von Aragon Nuance verlangt folgende Daten über das Kundenkonto hoch zu laden:
eine erstellte Systeminformationsdatei.nfo die Datei Dragon.log die Datei aus der Erkennungsansicht von einigen Steuerbefehlen im Internet Explorer.
Sobald mir eine Antwort des Supports vorliegt, leite ich sie an dieses Forum weiter.
Es sei mir verziehen, falls den Tipp jemand in diesem Faden schon erwähnt hat, den ich jetzt nicht in seiner ganzen Länge gelesen habe.
Weil auch bei mir der Drachen bei aneinandergereihten Substantiven, wie sie bevorzugt in stichpunktartigen Protokollen auftreten, unter Kompositabildung leidet, helfe ich mir wie folgt. Ich habe mir angewöhnt, aneinandergereihte Substantive, die zur Kompositabildung neigen (Beispiel: „Besprechung Fraktion" wird bei mir immer zur „Besprechungsfraktion"), durch das Kommando „leertaste" zu trennen. Braucht zwar etwas länger, um diktiert zu werden, ist aber immer noch schneller als nachträgliche Korrektur oder gar Tippen.
DNS 15.3 Professional Individual auf Windows 10 Home (64-bit) Plantronics PLT Savi W440 Intel (R) Core (TM) i7-7500 2,7 GHz 8 GB RAM 64 Bit
Harald, vielen Dank, dass Sie das noch mal öffentlich sagen. Diesen Trick habe ich genau in den von Ihnen beschriebenen Situationen eingesetzt. Mit Version 12 ist das nach meiner Auffassung nicht (mehr) nötig - und ich hätte nicht viel Lust, künftig mit 13 wieder auf diesen Würgaraund zurückgeworfen zu werfen.
Willkommen in der Welt der kontinuierlichen Spracherkennung!
Was die "Schärfe" oder Granularität der Kompositabildung im Deutschen - und ja, selbstverständlich ist das im Deutschen ein Problem, aber nicht im Englischen, weil es das dort nicht gibt, aber auch im Niederländischen - betrifft, das ist sicherlich eine Gratwanderung erstens Grades. Wenn ich das richtig verstehe, gibt es irgendwo "Stellschrauben", die mal in die eine, mal in die andere Richtung gedreht werden, zwischen den Versionen.
Immer im Bemühen, die prinzipiell undefinierbare, grenzenlos kreative Potenz der spontanen Wortschöpfung im Deutschen, indem aus zwei oder mehr Wörtern auf die Schnelle mal ein neues gemacht wird, dazu noch mit filigranen Regeln, nach denen die Einzelelemente miteinander verbunden werden, algorithmisch abzubilden.
Für "natürliche" Sprecher eine leichte Übung, in verschiedenen Schwierigkeitsstufen, aber auch ohne Vorbildung und unbewusst tägliche Routine, für Maschinen aber keine kleine Sache, so weit ich es sehe.
_______________________________________
Dragon Professional 16 auf Windows 10 Pro und Windows 11 SpeechMike Premium (LFH3500); Office 2019 Pro + Office 365 (monatliches Abo) HP ZBook Fury 17 G8 - i7-11800H - 24 MB SmartCache - 32 GB RAM - 1 TB SSD
Willkommen in der Welt der unsorgfältigen Programmierung!
Selbst verständlich (selbstverständlich) ist die korrekte Umsetzung von spontanen Komposita (also solchen, die nicht im Vokabular schon als Zusammensetzungen enthalten sind) eine echte Herausforderung, die nur näherungsweise fehlerfrei funktionieren kann (wie die Spracherkennung als solche auch). Trotzdem ist es nicht ganz fair, der Komplexität der (deutschen) Sprache die Verantwortung zuzuschieben, wenn das Problem schon einmal hervorragend gelöst wurde (in Version 12), dann aber – vermutlich aus Nachlässigkeit, wenn man der Hotline glauben will – ein programmatischer Rückschritt eintritt. Auch wenn klar ist, dass man mit manchen Unzulänglichkeiten systembedingt immer wird leben (diktieren) müssen, wie etwa bei homophonen Wörtern, sollte man nicht mutwillig hinter den erreichten Stand zurückfallen. Ich habe jedenfalls von niemandem gehört, dass in der Version 12 zu wenig automatische Komposita gebildet worden wären.
Wie die Amerikaner sagen: Wenn etwas nicht kaputt ist, soll man es nicht reparieren.
Selbstverständlich (selbst verständlich) spielt auch das Verhalten des Sprechers eine Rolle. So wird das am Anfang des vorhergehenden Satzes stehende Wort typischerweise dann als Kompositum erkannt, wenn es auf der ersten Silbe deutlich betont wird, sonst aber getrennt geschrieben (wobei hier beide Formen ohnehin im Vokabular enthalten sind, es also um die Homophonie geht).
Jedenfalls entnehme ich Deinen Worten, dass Du Dich nicht abschrecken lassen möchtest und Dir die Version 13 zulegen wirst. Bin sehr gespannt auf die ersten Berichte eines Profis über die Profi-Edition.
Die Anfrage kann man telefonisch über 06951 / 70 93 63 starten. Man erhält dann eine Mail mit allen geforderten Details inkl. Anleitung zur Erstellung der Dateien (z.B. *.nfo Datei). Die Rückantwort mit den hochzuladenden Dateien muß über das Kundenkonto erfolgen (zuvorige Registrierung erforderlich - nicht identisch mit der Aktivierung per Mausklick bei der Neuinstallation).
Man kann auch die Anfrage ohne Anruf über besagtes Kundenkonto starten. Der Bearbeitungsstand wird im weiteren Verlauf dort angezeigt.
Die Idee mit den Pausen bzw. Leerzeichen ist zumindest in meinem Fall nicht praktikabel, da sämtliche eigene Vokabeln (Substantive) davon betroffen sind.
DNS 13 Premium mit Mikrofon Voicerecorder Zoom H1 / CPU: AMD FX-6100 mit 8 MB Cache / 8 GB Ram / Windows 7 Professional 64 Bit
Kurze Zwischenmeldung: Ich habe ebenso wie Aragon die nötigen Dateien an den Support übermittelt – dieser Vorgang war recht unkompliziert.
Man hat mir nun mitgeteilt, dass man das Problem der unerwünschten Kompositabildung eskalieren wird, um zeitnah eine Lösung (Patch) anzubieten. Sobald diese vorliegt, werde ich von Nuance kontaktiert.
Weitere User-Anmerkungen zu dem Thema nimmt man gerne entgegen!
Vielen Dank für diesen detaillierten Thread. Obwohl der Thread schon etwas älter ist, würde ich gerne wissen, ob Ihr Anfrage doch noch irgendwelche Ergebnisse erzielt hat? Ein Patch kam ja bisher nicht heraus.
Ich benutze DNS schon seit der Version 10 und habe berufsbedingt in meiner Datenbank mehr als 90.000 Ortschaften integriert. Diktiere ich nun "Burg Kriebstein" wird daraus "Burgkriebstein". Das gleiche Phänomen tritt bei Burg, Schloss, Stadt, Herrschaft, usw. auf. Korrekturen bringen nichts. Mittlerweile habe ich mir auch angewöhnt diese Wörter als "Burg Leertaste Kriebstein" zu diktieren, was ich leider im Redefluss immer wieder vergesse. Es betrifft ausschließlich Vokabeln, die eigens hinzugefügt wurden. Vorgegebenes Vokabular ist von dem Problem nicht betroffen. Das Problem trat bei mir schon bei 12.5 auf. Ich habe leider ein völlig neues Profil angelegt und mein perfekt eingestelltes Profil aufgegeben, weil ich dachte, dass der Fehler daher kommen könnte. Ein besseres Mikrofon macht da übrigens keinen Unterschied. ich benutze ein 300€ Rode-Mikrofon zum Diktieren, da ich Headsets nicht leiden kann.