Dragon Professional 16 auf Windows 10 Pro und Windows 11 SpeechMike Premium (LFH3500); Office 2019 Pro + Office 365 (monatliches Abo) HP ZBook Fury 17 G8 - i7-11800H - 24 MB SmartCache - 32 GB RAM - 1 TB SSD
Gibts da nen Wordaround oder muss ich ein Mausmakro aufnehmen was mir auf das Mic tippt ?
Und gleich noch eine Frage, kann man irgendwie den Status des Mics abfragen ? Toggle Befehle in Steuerungen sind immer Murks, besser wäre da ein Befehl : Mic an.
Ich baue gerade ein Speech to text System für meine schwerhörige Oma. Prinzipiell läuft alles, nur kann ich da nicht einfach nen PC hinstellen und sagen starte mal DNS und dann klick mit der Maus usw. Die gute Frau ist 80 und hat mit PCs, dem Interrnet und anderem neumodischem Kram nichts am Hut
Ich hab den PC schon so konfiguriert, dass er nachdem er Strom bekommt, alles automatisch läuft. Ich brauch also keine Tastatur oder Maus. Das einzige ist noch DNS, das startet nur bis Mic standby.
Bei allem Verständnis, aber was ist so schwierig daran, das Mikrofon nach dem Start von Dragon entweder mittels Drücken der numerischen Plus-Taste, Klick auf dem Mikro-Symbol oder per Sprachbefehl ("wach auf") einzuschalten?
Wenn das wirklich ein Problem darstellt, wie soll die Oma dann überhaupt mit der Bedienung von Dragon zurecht kommen, wenn das Mikrofon erst mal an ist?
Gehe ich recht in der Annahme, dass Sie selbst keinerlei Erfahrungen im Umgang mit Dragon haben?
Die von Ihnen beschriebenen Zusätze (Dragon mit offenem Mikro starten - den Mikro-Status programmatisch abfragen - zusätzliche Mikro-Steuerung) sind alle möglich, wenn man über die Mittel verfügt, die Dragon API stellt das alles bereit.
Ich habe diverse Utilities für Dragon programmiert, um etwa Querschnittsgelähmten oder Blinden den Zugang zum Computer mit Dragon zu erleichtern, also weiß ich, wovon ich rede.
In dem Fall halte ich Ihre Pläne aber für nicht zweckmäßig.
_______________________________________
Dragon Professional 16 auf Windows 10 Pro und Windows 11 SpeechMike Premium (LFH3500); Office 2019 Pro + Office 365 (monatliches Abo) HP ZBook Fury 17 G8 - i7-11800H - 24 MB SmartCache - 32 GB RAM - 1 TB SSD
Ich baue ein System, welches einer seit ein paar Jahren schwerhörigen das Telefonieren wieder ermöglichen soll. Ich habe einfach den Lautsprecher des Telefonhörers abgegriffen und mit der Soundkarte verbunden. Dragon hört also die Stimme des Anrufers und soll diese auf Omas Bildschirm anzeigen. Dann kann Oma ganz normal per Sprache antworten.
Das Szenario zeigt, das Kommando "wach auf" fällt schonmal flach. Ich kenne meine Familie, die anderen beiden Möglichkeiten fallen ebenfalls raus. Entweder das Teil funktioniert autonom oder es wird nicht angenommen.
Ich wollte mittels Reed Kontakt den Telefonhörer als Trigger nutzen. Hörer abgenommen, PC wacht auf (starten wäre zu langsam) und das Mic wird eingeschaltet. Dann läuft der Text im Dragonpad. Nach Auflegen des Hörers wird der Text gelöscht und es kann von vorn losgehen.
Klingt alles ziemlich illusorisch. Testen Sie das alles doch erst einmal in der Praxis, ohne die zusätzlichen Schaltungen.
_______________________________________
Dragon Professional 16 auf Windows 10 Pro und Windows 11 SpeechMike Premium (LFH3500); Office 2019 Pro + Office 365 (monatliches Abo) HP ZBook Fury 17 G8 - i7-11800H - 24 MB SmartCache - 32 GB RAM - 1 TB SSD
Dragon Professional 16 auf Windows 10 Pro und Windows 11 SpeechMike Premium (LFH3500); Office 2019 Pro + Office 365 (monatliches Abo) HP ZBook Fury 17 G8 - i7-11800H - 24 MB SmartCache - 32 GB RAM - 1 TB SSD
Mit http://www.sikuli.org/ kann man mit sehr geringe Aufwand ein Programm schreiben, welches das gelbe Mikrofon-Symbol identifiziert und darauf klickt. Allerdings dauert es bei mir 16 Sekunden von Programmstart bis Ausführung. Wenn sie jedoch den Sikuli-Server im Hintergrund laufen lassen (wie es z.B. das Projekt Caster tut - wie das geht, können Sie sich vielleicht da abgucken), sind es nur eine Sekunde. Bei einem einfachen Klick sollte das Programm auch sehr zuverlässlich agieren.
DNS 13 Premium auf Windows 10 (64-bit) Logitech PC 960 Stereo Headset USB Intel Core i5-4200U 1.6 GHz - 4 MB L3-Cache - 4 GB RAM
Ich versteh es aber noch nicht ganz - sie greifen den Ton des Telefonhörers ab, senden es an den Computer.... und dann? Spielen sie es dort noch mal über Computerboxen ab, sodass Dragon die Sprache über das eingeschaltete Mikrofon erfassen und verarbeiten kann?
DNS 13 Premium auf Windows 10 (64-bit) Logitech PC 960 Stereo Headset USB Intel Core i5-4200U 1.6 GHz - 4 MB L3-Cache - 4 GB RAM
Zitat von KALDragon soll in Echtzeit lauschen und das Gespräch des Anrufers mitschreiben. (Was ja die Kernkompetenz von Dragon ist).
Eines jeden, beliebigen Anrufers? Auf die Erkennungsrate bin ich sehr gespannt, zumal Sprache übers Telefon akustisch nicht gerade das Nonplusultra darstellt. Da wird die Oma sich vor manches Rätsel gestellt sehen. Die Kernkompetenz von Dragon ist immer noch die Sprach-Wiedererkennung.