Also ich war davon ausgegangen, dass die Sekretärin allenfalls ein Benutzerprofil nutzt, in diesem Fall allerdings nicht in meinem oder ihrem Benutzerprofil herum schreibt. Ich habe hier im Forum und bei privaten Gesprächen erfahren, dass es sowieso problematisch ist, wenn derjenige, der korrigiert, im Profil herum schreibt. Das kann dann angeblich zu einer Verschlechterung führen. Im Beitrag "Spracherkennung versus Schreibkraft" hatten wir ja dazu schon diskutiert und einige Anregungen von anderen Nutzern bekommen. Interessant schien mir insbesondere die Methode, einen Teil des Schriftverkehrs korrigieren zu lassen und die Benutzerprofilverbesserungen ausschließlich bei eigenen E-Mails und Forumsbeiträgen durchzuführen. Für mich selbst bedeutet das allerdings, dass sich das Benutzerprofil wahrscheinlich in eine unerwünschte Richtung entwickelt. Meine privaten E-Mails und Beiträge in Foren sind oft keine juristischen Texte. Im Augenblick kontrolliere ich alles selber, das Sekretariat macht dann nur noch die Feinarbeit, also die Groß- und Kleinschreibung und solche Dinge. Aber mit Umstellung auf die angekündigte Doppelklicköffnung von DragonPad-Dateien wird sich das sicher ändern und ich werde die Ergänzung des Benutzerprofils durch mein Sekretariat ausprobieren.
Zurück zum Thema hier - das für mich übrigens verständlich im letzten Beitrag von ihnen erläutert war - bin ich mir nicht ganz sicher, ob es wirklich funktionieren würde. Ich kann mir vorstellen, dass die Zuordnung des richtigen Tons zum richtigen Text nicht mehr funktioniert, wenn mit mehreren verschiedenen Benutzerprofilen an einer Datei gearbeitet wird.
Grüße
A. Wagner
[Dragon Legal Anywhere mit SpeechMIke LFH 3510, Intel(R) Core(TM)I7-7500 CPU, 16 GB RAM, Windows 10 Pro. 64 Bit [/i]
ZitatIch habe hier im Forum und bei privaten Gesprächen erfahren, dass es sowieso problematisch ist, wenn derjenige, der korrigiert, im Profil herum schreibt. Das kann dann angeblich zu einer Verschlechterung führen.
Hallo Herr Wagner,
weil wir spätestens an dieser Stelle bei einem völlig anderen Thema angekommen sind, habe ich mir erlaubt, es auch als ein solches zu deklarieren und an den nach meinem Dafürhalten passenden Ort zu verschieben. Der Titel "Korrektur durch Dritte" ist möglicherweise unzutreffend gewählt, nämlich mehr an das englische Original angelehnt, ich bitte um Nachsicht. Gemeint ist selbstverständlich die Korrektur durch eine fremde Person.
Wie kann eine solche Korrekturmethode sinnvollerweise durchgeführt werden, damit einerseits die Arbeit damit bewältigt wird und andererseits das dabei verwendete Profil nicht beschädigt wird, sondern im Gegenteil die Erkennungsgenauigkeit verbessert?
Voraussetzung dafür ist, dies nur noch einmal der Vollständigkeit halber, dass die Audiodatei zusammen mit dem Text abgespeichert wird, was nur in den professionellen Versionen möglich ist und wozu die Optionen entsprechend einzustellen sind.
Bei dieser Methode ist es sozusagen Pflicht, das vor Durchführung der Korrektur einer Textpassage der zu Grunde liegende Audiopart vorher abgehört wird, so dass es also zu empfehlen ist, dass diese Funktion automatisch per Option eingestellt wird ("Diktatwiedergabe bei Korrektur").
Nur in solchen Fällen, wo das gesprochene Diktat klar und deutlich war, jedoch nur lediglich nicht wie gewünscht oder wie zu erwarten umgesetzt wurde, ist die Verwendung der Korrektur beziehungsweise des Buchstabenfensters überhaupt statthaft. Sofern der intendierte Text im Korrekturmenü erscheint, kann er dann sofort mittels "nimm..." übernommen werden. Taucht er nicht exakt, aber so ähnlich im Korrekturmenü auf - zum Beispiel weil die verwendeten Wörter nicht im Vokabular sind -, kann die "Korrekturkraft" den richtigen Text mittels Tastatur in Buchstabierfenster eingeben, wenn sie streng den Zusammenhang zwischen Text und Audiopart beachtet.
In beiden Fällen wird das Profil dabei nicht beschädigt, sondern im Gegenteil wird die Erkennungsgenauigkeit dabei verbessert. Dies hängt damit zusammen, dass Text und Audiopart bei dieser Methode "synchronisiert" werden, mit anderen Worten der geschriebene Text nun dem entspricht, was beabsichtigt war, nur lediglich vom Programm nicht richtig umgesetzt worden ist.
Wenn aber, im umgekehrten Fall, der Text unsauber diktiert wurde oder aber absichtlich ein völlig anderer Text als diktiert nachträglich ergänzt oder komplett gewechselt werden soll, darf der Audiopart an dieser Stelle grundsätzlich nicht in die Korrekturfunktion einbezogen werden. In diesen Fällen also wäre es zu empfehlen, dass der falsche Text markiert und direkt mittels Tastatur entfernt oder überschrieben wird.
Zwar sind danach Text und Audiopart auch nicht mehr synchron, so dass diese Methode so sparsam wie möglich anzuwenden ist, wobei grundsätzlich anzumerken ist, dass Dragon NaturallySpeaking ein Diktier-, nicht jedoch ein Editierprogramm ist, und für umfangreichere Textüberarbeitungen ohnehin nicht konzipiert ist.
Warum ist das alles so wichtig? - Die Synchronizität zwischen Text und Audio ist für das "Verständnis" von Dragon NaturallySpeaking von fundamentaler Bedeutung und spielt insbesondere bei den gelegentlich auszuführenden Optimierungen eine entscheidende Rolle. Sämtliche diktierten und nach dieser Methode auch später noch korrigierten Texte werden in Kopie im Hintergrund gespeichert und dabei herangezogen, wobei die während des Diktates oder oder auch bei späterer Nachbearbeitung vorgenommenen Korrekturen insbesondere betrachtet und ausgewertet werden, was schließlich dazu führen soll, dass sich die Erkennungsgenauigkeit im Laufe der Zeit immer mehr verbessert.
Zusammenfassung: Auch bei Fremdkorrektur, sofern richtig durchgeführt, kann die Erkennungsgenauigkeit grundsätzlich verbessert werden, dies jedoch nur in wesentlich geringerem Umfang als bei den unmittelbar während des direkten Diktates vorgenommenen Korrekturen durch den Autor selbst.
Inwieweit es sich bei dieser Methode jedoch noch um eine "effiziente", passend zur Kategorie dieses Themas, handelt, sei dahingestellt.
Viele Grüße Rüdiger Wilke
_______________________________________
Dragon Professional 16 auf Windows 10 Pro und Windows 11 SpeechMike Premium (LFH3500); Office 2019 Pro + Office 365 (monatliches Abo) HP ZBook Fury 17 G8 - i7-11800H - 24 MB SmartCache - 32 GB RAM - 1 TB SSD
Zitat von R.Wilke Inwieweit es sich bei dieser Methode jedoch noch um eine "effiziente", passend zur Kategorie dieses Themas, handelt, sei dahingestellt.
Viele Grüße Rüdiger Wilke
In der Tat würde ich grundsätzlich empfehlen, die Korrektur lieber selbst vorzunehmen, weil das beschriebene Vorgehen für die Korrekturkraft eine, sagen wir mal, Herausforderung darstellt und der Autor im Zweifel am sorgfältigsten und schnellsten korrigieren wird. Damit ist nicht gesagt, dass es nicht sinnvoll ist, das Ergebnis auf die herkömmliche Weise im Sekretariat Korrektur lesen und in die Endform bringen zu lassen, ich glaube aber, dass die Zahl der vom Autor übersehenen Fehler, die dann nur noch ohne Effekt auf die Verbesserung des Benutzerprofils händisch korrigiert werden, auf diese Weise immer noch kleiner ist als in der Variante „Korrektur durch Dritte“ die Zahl der Fehler, die von der Korrekturkraft ohne Verbesserung des Benutzerprofils oder unter „fälschlicher Verbesserung“ korrigiert werden. Außerdem hat nur der Autor die Möglichkeit, hartnäckige Fehler auch durch die Option „Trainieren“ im Buchstabierfenster zu bereinigen.
Der typische Einwand, dass die Arbeitskraft des Diktanten ungleich teurer ist als die der Korrekturkraft, ist zwar prinzipiell richtig, der Zeitaufwand für die Korrektur ist aber gering, wenn sie beim Diktieren mit erledigt wird,
....aber das haben wir ja schon in dem Thema „Spracherkennung vs. Schreibkraft“ umfassend behandelt.
Grüße, Marius Raabe
Dragon NaturallySpeaking 11.5 Legal Windows 7 Prof. 64-Bit, Office 2010, Jarte Plus Philips SpeechMike II Pro Plus, SpeechMike III, SpeechMike Air, PDCC 2.8 Intel Core2 Quad Q9550, 2,83 GHz, 2x6MB L-2, 8 GB RAM
könnten Sie bitte noch etwas dazu sagen, ob das beschriebene Vorgehen der Korrekturen durch das Sekretariat unter Verwendung einer Preferred-Version mit dns.comfort nicht genauso für eine Verbesserung des Benutzerprofils eingesetzt werden kann?
Zum Verständnis noch eine Frage: wenn ich, wie hier vorgeschlagen, nicht alle Schreiben selbst korrigiere, sondern eine Auswahl vornehme, dann hat das nach meinem Verständnis doch zur Folge, dass im Benutzerprofil falsch umgesetzte Ausdrücke doch als "richtig" erkannt und verarbeitet werden. Wenn ich dann am Ende einer solchen Sitzung das Profil speichere, dann müsste sich doch auf Dauer die Erkennungsgenauigkeit verschlechtern, oder etwa nicht? Müsste ich dann nicht idealerweise das Speichern des Benutzerprofils abstellen bzw. nicht vornehmen?
Mit freundlichen Grüßen
Angelika Brüggemann
Laptop: Intel Core 2 Duo P8700 (2,53 GHz, 3 MB L2 Cache), 4 GB RAM, Windows 7 32-Bit, DPI 15, MS Office 2007, Olympus DR-1000, Samson GoMic PC: Intel i5, Windows 7 64-bit, Dragon NaturallySpeaking 13 Prof, MS Office 2013
Zitat von Brügge1{könnten Sie} kannst Du bitte noch etwas dazu sagen, ob das beschriebene Vorgehen der Korrekturen durch das Sekretariat unter Verwendung einer Preferred-Version mit dns.comfort nicht genauso für eine Verbesserung des Benutzerprofils eingesetzt werden kann?
Hallo Angelika,
für die hier beschriebene Korrekturmethode ist die Professional Version Voraussetzung, ob sich daran für Preferred durch den Einsatz von dns.comfort etwas ändert, und wenn ja, in welcher Weise, vermag ich nicht zu beurteilen, und bitte also um Nachsicht, dass ich darauf nicht näher eingehe.
Zitat Zum Verständnis noch eine Frage: wenn ich, wie hier vorgeschlagen, nicht alle Schreiben selbst korrigiere, sondern eine Auswahl vornehme, dann hat das nach meinem Verständnis doch zur Folge, dass im Benutzerprofil falsch umgesetzte Ausdrücke doch als "richtig" erkannt und verarbeitet werden. Wenn ich dann am Ende einer solchen Sitzung das Profil speichere, dann müsste sich doch auf Dauer die Erkennungsgenauigkeit verschlechtern, oder etwa nicht? Müsste ich dann nicht idealerweise das Speichern des Benutzerprofils abstellen bzw. nicht vornehmen?
Das ist dann wiederum mein Thema! Ganz schlüssig gefolgert und in letzter Konsequenz auch irgendwie richtig. Aber vorweggenommen, es ist alles nur halb so schlimm. Wenn Wörter oder Ausdrücke nicht wie beabsichtigt umgesetzt werden, anschließend aber keine Korrekturen durchgeführt werden, verschlechtert sich das Profil dadurch nicht, es wird nur nicht besser, und man lässt sozusagen "wertvolle Punkte liegen".
Wenn dann dasselbe Wort oder derselbe Ausdruck erneut diktiert werden, wird typischerweise derselbe Fehler wieder auftreten, und der Drachen hat keine Möglichkeit, sich weiterzuentwickeln. Der Drachen arbeitet mit dem, was er von Haus aus hat, und dem, was er zusätzlich lernt. Wenn er nichts Neues lernt, bleibt er auf der Stelle stehen, aber auch nicht notwendigerweise schlechter werden.
Ich kann dieses Phänomen regelmäßig beobachten, wenn ich Aufnahmen vom Diktiergerät, die ich bei bestimmten Ortsterminen anfertigen muss, umsetzen lasse. Dabei tauchen immer wieder dieselben Verwechslungen auf, nicht selten mehrmals hintereinander im selben Text, und zwar so lange, bis ich die falsch erkannten Wörter und Ausdrücke entweder korrigiere oder erst neu hinzufüge.
Insofern ist es eigentlich beliebig, ob Du das Benutzerprofil unter den von Dir beschriebenen Umständen speicherst oder nicht, falls Du aber während der Sitzung wichtige Korrekturen und Ergänzungen vorgenommen hast, würdest Du auch diese verlieren, wenn Du nicht speicherst. Übrigens, ich speichere meine Benutzerdateien grundsätzlich immer, habe allerdings die Automatik abgeschaltet, für den Fall, dass während der Sitzung irgendetwas Dramatisches passiert - was aber glücklicherweise so gut wie nie der Fall ist.
Viele Grüße (trotz Kompositabildung!) Rüdiger Wilke
_______________________________________
Dragon Professional 16 auf Windows 10 Pro und Windows 11 SpeechMike Premium (LFH3500); Office 2019 Pro + Office 365 (monatliches Abo) HP ZBook Fury 17 G8 - i7-11800H - 24 MB SmartCache - 32 GB RAM - 1 TB SSD
also ich finde den beschriebenen Effekt durchaus ein weiteres relevantes Argument dafür, die Korrektur lieber selbst zu übernehmen. Denn gemäß der Regel: ein Fehler kommt selten allein, oder auch Murphy's Gesetz, treten gerade eher seltene oder schwierige Ausdrücke mehr als einmal in demselben Text auf. Das bedeutet, dass auch die Korrekturkraft mehrfach eingreifen muss, wo der Diktant schon nach der ersten Korrektur die Sache bereinigt hätte. So stelle ich mir das zumindest theoretisch vor, praktisch habe ich es wie gesagt noch nicht ausprobiert. Ich kenne den Effekt aber wie Du, Rüdiger, von der Umsetzung von Texten aus dem Diktiergerät, hier ist die Korrektur deutlich nerviger wegen des beschriebenen Effekts.
Ich bin mir außerdem nicht sicher, lieber Rüdiger, ob die wiederholt unterlassene Korrektur nicht doch über Silent-Adapt zu einer Verschlechterung des akustischen Modells führt, oder wird dann, wenn deutlich später (zum Beispiel am nächsten Tag) die Korrektur von der Korrekturkraft vorgenommen und in das zentrale Benutzerprofil gespeichert wird, ein zwischenzeitliches Silent-Adapt überschrieben? Oder meinst du einfach, dass diese Effekte so sporadisch sind, dass sie insgesamt nicht ins Gewicht fallen?
Viele Grüße (ebenfalls trotz Kompositaautomatik) und ggf. schönen Tanz in den Mai – gewaltfrei natürlich –,
Marius Raabe
Dragon NaturallySpeaking 11.5 Legal Windows 7 Prof. 64-Bit, Office 2010, Jarte Plus Philips SpeechMike II Pro Plus, SpeechMike III, SpeechMike Air, PDCC 2.8 Intel Core2 Quad Q9550, 2,83 GHz, 2x6MB L-2, 8 GB RAM
Zitat von Marius RaabeIch bin mir außerdem nicht sicher, lieber Rüdiger, ob die wiederholt unterlassene Korrektur nicht doch über Silent-Adapt zu einer Verschlechterung des akustischen Modells führt, oder wird dann, wenn deutlich später (zum Beispiel am nächsten Tag) die Korrektur von der Korrekturkraft vorgenommen und in das zentrale Benutzerprofil gespeichert wird, ein zwischenzeitliches Silent-Adapt überschrieben? Oder meinst du einfach, dass diese Effekte so sporadisch sind, dass sie insgesamt nicht ins Gewicht fallen?
Lieber Marius,
na, endlich sind wir bei den interessanten Themen angekommen. Wie schon weiter oben gesagt, in letzter Konsequenz ist etwas daran, dass unterlassene Korrekturen, je nach Gewichtung, auch zu einer Verschlechterung des Profils führen können - theoretisch, und unter ganz bestimmten Bedingungen. Um das zu verstehen, muss man das von Dir angesprochene SilentAdapt näher betrachten.
SilentAdapt, zu Deutsch etwa "Anpassung im Stillen oder Verborgenen", wozu noch die ergänzenden Termini PASS (PelAudio Aucoustic Scale Score; PEL = phonetic element) und OUFA (= online unsupervised feature adaption; feature = phonetic element) existieren und in der Literatur in etwa gleichwertig verwendet werden, ist ein Mechanismus, der dazu dient, dass bei Verwendung der Spracherkennungssoftware diese permanent trainiert wird. "Training" im Zusammenhang mit Spracherkennungssoftware bedeutet Anpassung der dem Erkennungsprozess zu Grunde liegenden Muster, meistens mathematische Repräsentationen akustischer Einheiten im Kontext, also im Prinzip Repräsentationen von Sprachlauten = Phoneme bwz. Phonemvarianten. Anzumerken ist, dass die hier erwähnten Mechanismen allesamt auf der lautlichen Ebene, dem sog. Akustischen Modell, wirken.
Was bedeutet das praktisch betrachtet? - Wir diktieren eine Äußerung, Dragon setzt sie um nach den oben angesprochenen Prinzipien. In der Regel setzt Dragon immer irgendetwas um, und wenn es uns noch so entfernt von dem scheint, was wir gesprochen haben, außer wenn Dragon sich entscheidet, dass wir nichts Umsetzungsfähiges diktiert haben, und dies mit quittiert.
Wird das Diktat nun "fehlerfrei" - im Sinne dessen, was wir beabsichtigt haben - umgesetzt, werden die zu Grunde liegenden erkannten Muster dadurch bestätigt, und die Erkennung derselben Ausdrücke bei nächster Gelegenheit umso wahrscheinlicher. Zugleich wird jedes verwendete (also erkannte) Wort aufgewertet, wenn auch nur minimal, indem sein Wahrscheinlichkeits-Koeffizient erhöht wird. Jeder, der die Software ernsthaft und dauerhaft verwendet, wird bestätigen, dass die Wörter, die immer wieder oder nur häufig genug verwendet werden, in der Regel - Ausnahmen ausgenommen - unproblematisch sind, dagegen Wörter, die zum ersten Mal oder nur sehr selten verwendet werden, vergleichsweise höhere Unsicherheiten in sich bergen.
Wird das Dikat aber nicht wie erwartet umgesetzt, und gleichartige Fehl-Erkennungen dauerhaft nicht korrigiert, kann es auf lange Sicht schon dazu kommen, dass die Muster falsch zugeordnet werden, allerdings, da Spracherkennung immer auf mehreren Ebenen statt findet, besser gesagt, letztendlich entschieden wird - vom kleinsten Elementarteilchen, dem PEL, das sind meines Wissens so etwa 2.000, zur nächsthöheren Ebene, dem Wort, zur Äußerung im Kontext, und wieder zurück -, dürfte sich das System allerdings immer wieder von selbst stabilisieren, es sei denn, dass es wegen all zu abweichender Aussprache völlig aus den Fugen gerät und das akustische Modell auf Dauer unbrauchbar wird.
Mit anderen Worten: Korrektur, richtig vorgenommen, kann sicher nicht schaden, sie zu unterlassen muss aber nicht zwangsläufig dazu führen, dass die Erkennung schlechter wird, definitiv wird sie dabei aber auch nicht besser.
Viele Grüße Rüdiger
_______________________________________
Dragon Professional 16 auf Windows 10 Pro und Windows 11 SpeechMike Premium (LFH3500); Office 2019 Pro + Office 365 (monatliches Abo) HP ZBook Fury 17 G8 - i7-11800H - 24 MB SmartCache - 32 GB RAM - 1 TB SSD
Zitat von R.Wilke Mit anderen Worten: Korrektur, richtig vorgenommen, kann sicher nicht schaden, sie zu unterlassen muss aber nicht zwangsläufig dazu führen, dass die Erkennung schlechter wird, definitiv wird sie dabei aber auch nicht besser.
Vielen Dank, lieber Rüdiger, für die wie üblich kompetente Explikation der technischen Zusammenhänge. Deine abschließende These müsste man im Lichte dieser Ausführungen aber eigentlich ergänzen:
„... sie zu unterlassen, kann, muss aber nicht zwangsläufig...“
Eigentlich sehe ich meine These bestätigt, dass ein Perfektionist, der auf eine bestmögliche Anpassung des akustischen Modells aus ist, damit das linguistische Modell in der nächsten Stufe der Verarbeitung das bestmögliche Eingangsmaterial erhält, möglichst unmittelbar nach jedem Fehler selbst korrigierend eingreift.
Sonnigen Feiertag, Marius Raabe
Dragon NaturallySpeaking 11.5 Legal Windows 7 Prof. 64-Bit, Office 2010, Jarte Plus Philips SpeechMike II Pro Plus, SpeechMike III, SpeechMike Air, PDCC 2.8 Intel Core2 Quad Q9550, 2,83 GHz, 2x6MB L-2, 8 GB RAM
ZitatEigentlich sehe ich meine These bestätigt, dass ein Perfektionist, der auf eine bestmögliche Anpassung des akustischen Modells aus ist, damit das linguistische Modell in der nächsten Stufe der Verarbeitung das bestmögliche Eingangsmaterial erhält, möglichst unmittelbar nach jedem Fehler selbst korrigierend eingreift.
Völlig richtig, Herr Lojewski. Mit dem Drachen ist es so ähnlich wie mit dem Kunst-Traktorfahren. Bei einer Radio-Reportage aus dem Münsterland anlässlich eines Meisterschaftswettbewerbs in dieser Diszplin wollte die Reporterin von einem der ortsansässigen Teilnehmer wissen, worin denn der Witz dabei besteht. Der Akteur tat sich sehr schwer mit der Antwort, regional nicht untypisch, druckste herum, die Reporterin aber musste doch auf eine Antwort drängen, so dass es schließlich aus ihm heraus schoss: "Wenn du dabei nicht von Anfang an alles akurat machst, kriechst du später unheimliche Malästen."
Wie man damit umgeht, ist unter anderem eine Temperaments- und Gemütsfrage, aber auch dadurch bestimmt, was man darüber weiß, und insofern auch eine intellektuelle Angelegenheit. Mein Eindruck ist, dass diejenigen, die auf Dauer gravierende Probleme mit der Erkennungsgenauigkeit haben, beim o.g. Wettbewerb besser nicht antreten würden.
Grüße Rüdiger Wilke
_______________________________________
Dragon Professional 16 auf Windows 10 Pro und Windows 11 SpeechMike Premium (LFH3500); Office 2019 Pro + Office 365 (monatliches Abo) HP ZBook Fury 17 G8 - i7-11800H - 24 MB SmartCache - 32 GB RAM - 1 TB SSD