Um mit einem hörgeschädigten Kollegen per Zoom-Videokonferenz kommunizieren zu können, habe ich eine prima Untertitel-Lösung gebaut, bestehend aus Dragon Professional 15, Google Chrome, CSS, jQuery, Blackmagic ATEM Mini, Elgato Streamdeck und einer SONY Spiegelreflex als Webcam: Auf einem externen Laptop wandelt Dragon meine Sprache in Text um, per Formulareingabe wird das direkt in eine lokale HTML-Seite geschrieben ("Lower Third", "Bauchbinde"), der HDMI-Ausgang geht in den ATEM Mini, dort wird der Text als Downstream Key direkt auf mein Webcam-Video eingeblendet. Das fertig gemischte Bild gelangt per USB-Out vom ATEM Mini, sozusagen "als Webcam getarnt", nach Zoom - und alle sind ziemlich glücklich.
Auf dem Streamdeck habe ich Steuerungsbefehle zum Beispiel für Clear Screen, Zeilenumbruch, Mikro an/aus. Die Schriftgröße der Untertitel passt sich sogar dynamisch der Textmenge an - ich könnte also auch eine ziemlich lange Textpassage abbilden (noch lesbar bis zu 10 Zeilen). Das ist wirklich super geworden. Im TV könnte es nicht besser aussehen. Und es waren nur wenige Stunden Aufwand, bis alles 100%ig funktioniert hat. Die Erkennungsrate ist sogar erheblich besser als ich jemals erwartet hätte.
Aus diesem Technologie-Stack kenne ich Dragon jedoch kaum, eigentlich bin ich nur Rookie-Benutzer einer lizensierten Version und habe bisher vielleicht ein paar Dutzend Vokabeln hinzutrainiert, mehr aber auch nicht. Daher habe ich möglicherweise eine Anfängerfrage - konnte aber in der Dokumenatation keinen Ansatz finden.
Frage: Kann ich im Diktiermodus die Interpunktionsanweisungen (insbesondere Komma, Punkt, Fragezeichen) nicht einfach im passenden Moment per Tastatur (bzw. Streamdeck) hinzufügen? Es wäre für das Gespräch mit dem Kollegen nämlich nicht besonders vorteilhaft, wenn ich ständig "... Punkt ... neuer Absatz ... Komma ... Fragezeichen" sagen müsste. Aus diesem Grund verzichte ich momentan komplett auf Satzzeichen in den Untertiteln.
Meine Tastatur ist mit dem Dragon-Untertitel-Laptop verbunden und auf den Google Chrome fokussiert. So kann ich bestimte Passagen auch manuell eingeben, etwa wenn zu viel Fachchinesisch darin vorkommt. Das heißt, ich könnte selbstverständlich ein Fragezeichen per Tastendruck anfügen. Dazu müsste ich aber immer die Verarbeitungspausen abwarten, bis der Satz von Dragon komplett ausgegeben wurde. Was bei einem Fragezeichen vielleicht noch funktioniert, wird im Fall eines Kommas mitten im Satz schon viel schwieriger. Dafür müsste ich unnatürlich lange Sprechpausen einlegen, was mir schwer fällt und beim Gegenüber zu Missverständnissen führt.
Ich möchte also während des Diktierens die gewünschten Satzzeichen synchron eintippen, um sie in einer Live-Unterhaltung nicht störenderweise mitsprechen zu müssen. Das wird doch bestimmt irgendwie gehen (ich fürchte ich habe mich einfach noch nicht intensiv genug mit der Doku befasst...)?
Danke für alle sachdienlichen Hinweise. Andreas
P.S. Lösungen mit dem Dragon-Diktierfenster sind in dieser Konstellation leider nicht geeignet, der Text muss unmittelbar zum Webbrowser gehen.
Zitat von Andreas64 im Beitrag #1Kann ich im Diktiermodus die Interpunktionsanweisungen (insbesondere Komma, Punkt, Fragezeichen) nicht einfach im passenden Moment per Tastatur (bzw. Streamdeck) hinzufügen?
Ja, während des Diktierens kann man die Tastatur benutzen. Gruß, Pascal
Leider definitiv nicht in der oben beschriebenen Konstellation!
Beispiel: Ich möchte diese Begrüßung diktieren: Hallo Martin, wie geht es Dir?
Ich kann, während ich spreche, das Komma und das Fragezeichen im richtigen Moment eintippen. Diese beiden Zeichen werden jedoch augenblicklich in der Zielanwendung ausgegeben. Dragon fügt kurz danach den gesamten diktierten Satz (natürlich ohne Satzzeichen) hinten an und ich erhalte auf dem Bildschirm:
,?Hallo Martin wie geht es Dir
Was ich brauche ist eine Lösung, wo Dragon bereits während des Zuhörens(!) die Satzzeichen exakt an der Stelle ("in dem Moment") einbaut, wo ich sie parallel zum Diktieren eintipppe. Also ohne sie auszusprechen!
Zitat von Andreas64 im Beitrag #4... und ohne dass ich längere Pausen beim Sprechen einlegen muss, um abzuwarten, bis Dragon die Halbsätze erkannt und ausgegeben hat.
Andreas 64 oder welcher Jahrgang auch immer, ungeachtet des unhöflichen Auftritts hier und der Tatsache, dass Sie ein Anfänger sind, was Ihnen vorschwebt, ist technisch nicht möglich, was Sie eigentlich selbst verstehen müssten, wenn Sie so viel technisches Verständnis hätten, wie Sie im Vortrag andeuten.
_______________________________________
Dragon Professional 16 auf Windows 10 Pro und Windows 11 SpeechMike Premium (LFH3500); Office 2019 Pro + Office 365 (monatliches Abo) HP ZBook Fury 17 G8 - i7-11800H - 24 MB SmartCache - 32 GB RAM - 1 TB SSD
Zitat von mbmz im Beitrag #6Was ar denn an Andreas Auftritt unhöflich?
Naja, nicht einmal die allgemein nassforsche Art des Auftritts, das sei der Unkenntnis geschuldet, aber die plumpe Reaktion auf den ersten Hilfeversuch und die dabei verwendeten Ausrufezeichen, zumal wenn er in ein Forum hineinplatzt mit einem Thema, von dem er gar keine Ahnung hat. Mag sein, dass es Leute gibt, die diesen Stil als normal empfinden, ich jedenfalls nicht.
_______________________________________
Dragon Professional 16 auf Windows 10 Pro und Windows 11 SpeechMike Premium (LFH3500); Office 2019 Pro + Office 365 (monatliches Abo) HP ZBook Fury 17 G8 - i7-11800H - 24 MB SmartCache - 32 GB RAM - 1 TB SSD
Da es ja "technisch nicht möglich" ist, habe ich mich von dem Ansatz verabschiedet, dass Dragon eventuell eine API dafür haben könnte. Stattdessen löse ich es nun so:
Auf dem Elgato Streamdeck liegen drei Tasten zum Auslösen von Audioclips, die ich mit derselben Mikrofonkombination aufgenommen habe wie beim Diktieren. Der eine Clip sagt "Komma", der nächste sagt "Punkt" und der andere "Fragezeichen". Den jeweiligen Button drücke ich nun an den entsprechenden Stellen, während ich spreche. Mikrofon und zugespielte Clips werden zusammengemischt über ein USB-Audiointerface an Dragons Spracherkennung geleitet.
So ist die nötige Sprechpause minimal und der Kollege mit der Hörschädigung bekommt bei Lippenlesen keine Schwierigkeiten. Es funktioniert ganz intuitiv.
Dragon Professional 16 auf Windows 10 Pro und Windows 11 SpeechMike Premium (LFH3500); Office 2019 Pro + Office 365 (monatliches Abo) HP ZBook Fury 17 G8 - i7-11800H - 24 MB SmartCache - 32 GB RAM - 1 TB SSD