Mein Problem: Nach einer Videokonferenz mit Teilnehmern aus verschiedenen Ländern, gesprochen wird in Englisch, habe ich die ehrenvolle Aufgabe ein Protokoll zu erstellen. Da ich das Englisch von Japanern und Franzosen manchmal schlecht verstehe, und auch so mancher Amerikaner einen fürchterlichen Slang drauf hat, frage ich mich, ob mir Dragon NaturalSpeaking hier helfen kann. Ich stelle mir vor, die Videokonferenz mit einem Diktiergerät, z.B. Sony ICD-SX 733D, aufzunehmen, und die Aufnahme anschließend auf meinem MAC mit Dragon NaturalSpeaking in Text umzuwandeln.
Frage: - Ist es technisch möglich? - Kann Dragon NaturalSpeaking verschiedene Stimmen erkennen? - Welche Version von Dragon brauche ich hierzu?
Ad 1): Nein. Gründe: (a) S. Antwort zu 2); (b) die Sound-Qualität wäre viel zu schlecht; (c) die Algorithmen von Dragon sind auf die Verarbeitung von strukturierter Sprache getrimmt, also das Diktat von Texten, nicht auf Konversation (erst recht nicht auf eine solche, die schon ein Mensch nur schwer versteht).
Ad 2): Ja und Nein. Die Software schon, das Benutzerprofil nicht. Dragon ist eine sprecherabhängige Spracherkennung (vgl. den Wikipedia-Eintrag), für jeden Benutzer muss ein individuelles Benutzerprofil (akustisches Modell und Sprachmodell) erstellt und am besten auch trainiert werden. Das Beispiel der unterschiedlichen Akzente zeigt schon, warum das so ist, von den unterschiedlichen akustischen Eigenschaften von Stimmen mal abgesehen. Außerdem erlauben die Lizenzbestimmungen nur einen Sprecher pro Lizenz.
Ad 3): Eine künftige ....
Selbst wenn all das anders wäre, wäre das Ergebnis bestimmt nicht toll. Wer liest schon gerne Wortprotokolle? In der Regel geht es doch darum, entweder das Gesagte sinngemäß zusammenzufassen oder gar nur Ergebnisse der Besprechung festzuhalten.
Gleichwohl kann Dragon Ihnen helfen! Nehmen Sie die Videokonferenz mit einem Diktiergerät auf, hören sich die Aufnahme an und diktieren parallel dazu in Dragon das Protokoll. Wenn auf diese Weise tatsächlich ein Wortprotokoll erstellt wird, spricht man auch gerne von „Echo-Diktat“. So arbeiten z.B. Gerichtsstenografen (court reporter) in den USA mit Dragon.
Lupus hat schon alles dazu gesagt, aber einen Punkt möchte ich noch einmal heraus stellen, weil er m.E. für die Beurteilung der Software, ihrer Möglichkeiten und Grenzen, enorm wichtig ist.
ZitatDa ich das Englisch von Japanern und Franzosen manchmal schlecht verstehe, und auch so mancher Amerikaner einen fürchterlichen Slang drauf hat, frage ich mich, ob mir Dragon NaturallySpeaking hier helfen kann.
Dahinter steckt wohl, wahrscheinlich durch die Werbung angeregt (wenig ist irreführender als Werbung), die Idee, die Maschine könne Sprache besser oder weniger mühevoll verstehen als Menschen. Genau das Gegenteil ist aber der Fall!
Man kann mit Sicherheit sagen, dass Sprache, die noch nicht einmal ein Mensch versteht oder worauf er/sie sich zumindest keinen Reim drauf machen kann, von keiner Maschine auf der Welt verstanden wird.
Gruß, RW
_______________________________________
Dragon Professional 16 auf Windows 10 Pro und Windows 11 SpeechMike Premium (LFH3500); Office 2019 Pro + Office 365 (monatliches Abo) HP ZBook Fury 17 G8 - i7-11800H - 24 MB SmartCache - 32 GB RAM - 1 TB SSD
Schade - es wäre doch so schön gewesen. Natürlich würde die Transkription nicht 1:1 als Protokoll verwendet werden. Aber vielen Dank für die aufschlussreichen und ehrlichen Antworten. Und danke für den Tip mit dem „Echo-Diktat“. Da Sony seine Recorder auch für Meetings empfiehlt, und diese auch zusammen mit DNS verkauft werden, kann doch leicht ein falsches Bild entstehen.
Zitat von svenkarfpDas geht auf jeden Fall Robi. Du musst ein paar Plugins draufspielen dann funzt es
Um es in dem gewohnt höflichen Ton dieses Forums zu sagen: Das ist auf jeden Fall Blödsinn. Wer sowas schreibt, zeigt nur, dass er keine Ahnung von der Funktionsweise von Dragon hat. Und wer dann noch die vermeintlich todsicheren Tipps nur per PM geben will, so dass diejenigen, die etwas von der Sache verstehen, keine Möglichkeit haben, diese zu überprüfen, gehört eigentlich gleich verbannt. Consider this a warning.
Zitat von svenkarfpDas geht auf jeden Fall Robi. Du musst ein paar Plugins draufspielen dann funzt es
Um es in dem gewohnt höflichen Ton dieses Forums zu sagen: Das ist auf jeden Fall Blödsinn. Wer sowas schreibt, zeigt nur, dass er keine Ahnung von der Funktionsweise von Dragon hat. Und wer dann noch die vermeintlich todsicheren Tipps nur per PM geben will, so dass diejenigen, die etwas von der Sache verstehen, keine Möglichkeit haben, diese zu überprüfen, gehört eigentlich gleich verbannt. Consider this a warning.
Das sehe ich auch so wie Lupus. Ungeachtet der Interessen dahinter passt das vom Auftritt und Vorgehen nicht hierhin, und wurde deshalb entfernt.
Gruß, RW
_______________________________________
Dragon Professional 16 auf Windows 10 Pro und Windows 11 SpeechMike Premium (LFH3500); Office 2019 Pro + Office 365 (monatliches Abo) HP ZBook Fury 17 G8 - i7-11800H - 24 MB SmartCache - 32 GB RAM - 1 TB SSD
Zitat von Robi Frage: - Ist es technisch möglich? - Kann Dragon NaturalSpeaking verschiedene Stimmen erkennen?
Dragon kann das aus den dargestellten Gründen nicht. Möglich wäre es unter Umständen mit Voice Pro Enterprise, zu finden unter www.spracherkennung.de. Voice Pro E. soll sprecherunabhängig funktionieren. Eigene Erfahrungen habe ich damit allerdings nicht.
Interessanter Hinweis – SO wünscht sich Lupus eine weiterführende Diskussion.
Lupus kannte das genannte Produkt bislang nur als „Aufsatz“ auf die Windows-Spracherkennung (mit allen damit verbundenen Schwächen). Bei der Enterprise-Version scheint es sich um eine Backend-Lösung (Umsetzung auf einem Server) zu handeln, wie bei den vielen Lösungen für mobile Endgeräte (Dragon Dictation für iOS/Android, Siri, OS X-Spracherkennung usw), die in der Tat mit einem sprecherunabhängigen Sprachmodell funktionieren. Lupus kann nur vermuten, dass es sich bei Voice Pro Enterprise ebenfalls um einen Aufsatz für eines dieser Backend-Systeme handelt. Nach den Werbeaussagen soll die Lösung auch für die Umsetzung von Mitschnitten, die Erstellung von Untertiteln usw. geeignet sein.
Lupus hat das Programm nicht ausprobiert und kann nur von seinen Erfahrungen mit Siri und Co. den Schluss ziehen, dass sprecherunabhängige Backend-Lösungen zwar schon erstaunlich gut funktionieren, aber das letzte Quäntchen an Lernfähigkeit und Anpassung doch vermissen lassen. Für ein ernsthaftes und berufsmäßiges Diktieren von komplexen Texten scheint Dragon NaturallySpeaking nach wie vor deutlich überlegen (und unverzichtbar). Ehrlich gestanden hegt Lupus sogar die subversive Hoffnung, dass die Frontend-Lösungen wie Dragon NaturallySpeaking ihre Vorteile behalten. Denn Lupus hätte schon berufsrechtliche Schwierigkeiten (Mandatsgeheimnis!) und auch prinzipielle Bedenken, sensible Diktate über die Cloud zu versenden, erst recht ins Ausland. Think global, compute local...
Der Artikel ist nach Lupus' Meinung nicht besonders kenntnisreich (schon deshalb keine Gewähr für die Richtigkeit des verlinkten Beitrags), gibt aber Aufschluss über praktische Erfahrungen mit Voice Pro Enterprise und auch über das (angebliche) Preismodell (120 € für 10 Stunden "Transkription").