ich möchte NaturallySpeaking 10 dazu nutzen, Aufnahmen zu transkribieren. Leider scheint es nicht möglich zu sein, Aufnahmen eines fremden Sprechers in Text umzuwandeln. Trotz des schlechten Ergebnisses, das ich erwarte, würde ich es aber gerne ausprobieren. Gibt es einen workaround dazu?
Leider geht das nicht, in aller Kürze gesagt. Dragon, aber auch alle anderen Programme zur Spracherkennung, benötigen ein zumindest minimal auf einen bestimmten Sprecher eingestelltes Benutzerprofil, weiterhin strukturiert eingegebenes Diktat (mit geeigneter Artikulation und vor allem Interpunktion), um brauchbare Umsetzungen liefern zu können.
Dass der Wunsch besteht, ist nachvollziehbar, diese Frage wird sehr oft in den (internationalen) Foren gestellt, aber leider ist der Stand der Technik noch nicht so weit, und bis dahin wird noch viel Zeit vergehen.
Grüße Rüdiger Wilke
_______________________________________
Dragon Professional 16 auf Windows 10 Pro und Windows 11 SpeechMike Premium (LFH3500); Office 2019 Pro + Office 365 (monatliches Abo) HP ZBook Fury 17 G8 - i7-11800H - 24 MB SmartCache - 32 GB RAM - 1 TB SSD
Ich erinnere mich, dass vor längerer Zeit im Knowbrainer-Forum einiges über Vokabulare und Benutzer geschrieben worden ist, die als so genannte Allround-Benutzer-Dateien von verschiedenen Anwendern genutzt werden konnten, habe das aber nicht weiter verfolgt, da mir die Ergebnisse eher mäßig schienen.
Letztendlich aber beruht die inzwischen für das iPhone (derzeit noch kostenlos beziehbare) Anwendung von Nuance mit dem Namen Dragon Dictation auf genau solchen Allround-Benutzer-Dateien. Man kann Text direkt über das im iPhone integrierte Mikrofon aufsprechen, der dann auf einen fremden Server hoch geladen und dort transkribiert wird. Ich habe das schon ausprobiert und die Ergebnisse sind nicht so niederschmetternd wie von mir zunächst vermutet, allerdings auch nicht so gut, wie mit der fest installierten Software Dragon NaturallySpeaking auf meinem PC oder Notebook. In jedem Fall aber lässt sich beispielsweise eine längere E-Mail für mich damit wesentlich schneller fertigen, als auf der kleinen Display-Tastatur des iPhones. Ob man vertrauliche Informationen auf einen fremden Server überträgt oder der Software gestattet, die Namen und Anschriften des Adressbuches im iPhone zu durchsuchen und für eine bessere Erkennung auf den Server hoch zu laden muss natürlich jeder sorgfältig abwägen. Man kann bei der Einrichtung der Software allerdings letzteres ausschließen.
Vor diesem Hintergrund vermute ich, dass es nicht mehr allzu lange dauern wird, bis uns die Benutzerdateien für mehrere verschiedene Anwender mit unterschiedlichen Stimmprofilen etc. auch für unsere PCs und Notebooks zur Umsetzung zur Verfügung stehen.
Mit freundlichem Gruß aus Hamburg Malte Rossbach Dragon legal individual 15.0 Windows 10 Prof. 64 bit, MS Office 2013, Intel Core i7 3770K, 16 GB RAM, Asus Xonar Soundkarte, Sennheiser MD 431 II; sowie Notebook, Core i5-6267U, 6 GB RAM, Windows 10 Home 64 bit, MS Office 2015, Sennheiser USB Headset PC 26. http://www.rechtsanwalt-rossbach.de
Solange, wie die wunschgemäße direkte Transkription von beliebigen Sprechern nicht möglich ist, also auf absehbare Zeit, sollte als Hilfslösung das so genannte Echo-Diktat in Erwägung gezogen werden: Spielen Sie einfach die Aufzeichnungen des fremden Sprechers per Tonband oder 2. PC ab und sprechen diese Äußerungen nach in die Spracherkennung, mit einem guten Mikrofon gibt es da auch keine Störungen (sage ich als einer, der manchmal daheim bei laufender Stereoanlage diktiert). Es geht auch noch extremer: Einige amerikanische Gerichtsstenografen und Angehörige vergleichbarer Berufsgruppen verwenden (wie man in Foren lesen konnte) für solche Zwecke übrigens ein Mikrofon mit einem speziellen Mundschutz, um „live“ nachzusprechen, ohne die Beteiligten zu stören. Mit einem guten Handmikrofon geht das auch ohne.
Grüße, Marius Raabe
Dragon NaturallySpeaking 11.5 Legal Windows 7 Prof. 64-Bit, Office 2010, Jarte Plus Philips SpeechMike II Pro Plus, SpeechMike III, SpeechMike Air, PDCC 2.8 Intel Core2 Quad Q9550, 2,83 GHz, 2x6MB L-2, 8 GB RAM