Nuance wirbt damit, mit der Transkriptionsfunktion wäre die Umsetzung von z.B. Podcasts möglich. Hat jemand Erfahrungen damit, wie gut das gelingt? Oder: Gibt es irgendwo eine Demo zum Testen, damit ich es selbst ausprobieren kann?
Es mag sein, dass die aktuelle Dragon-Version etwas besser mit der Umsetzung "fremder" Stimmen umgehen kann als die früheren Versionen, aber unterm Strich halte ich das für einen Marketing-Gag. Ein Anwalt, der regelmäßig im amerikanischen Forum schreibt und selbst erfahrener und langjähriger Anwender von Dragon ist, ging dem üblichen Kommerz-Hype des Forum-Betreibers auf den Leim und erhoffte sich, er könne nun seine Gespräche mit Klienten aufzeichnen und dann problemlos in Dragon umsetzen lassen.
Das Ergebnis war, wie zu erwarten, eine endlos lange, ununterbrochene Kette aneinander gereihter Wörter - weil niemand in freier Rede Interpunktion und Zeilenumbrüche oder Absätze spricht, wobei von der Fehlerzahl noch nicht mal die Rede war, aber das alleine war schon ein K.O.-Kriterium.
Also, versprechen Sie sich besser nichts davon, und: so etwas wie "Demo zum Testen" gibt es im Dragon-Land nicht, da zählt nur Cash.
_______________________________________
Dragon Professional 16 auf Windows 10 Pro und Windows 11 SpeechMike Premium (LFH3500); Office 2019 Pro + Office 365 (monatliches Abo) HP ZBook Fury 17 G8 - i7-11800H - 24 MB SmartCache - 32 GB RAM - 1 TB SSD
Ja, die beste Methode in solchen Fällen ist immer noch das Echodiktat: Die Aufnahme per Kopfhörer abhören und parallel dazu den Text diktieren, dann natürlich mit Satzzeichen usw., also ähnlich wie beim guten alten Phonodiktat im Sekretariat, nur halt nicht auf der Tastatur. Das ist aber in beiden Fällen nichts für Anfänger.
Zitat von antje.schweitzerNuance wirbt damit, mit der Transkriptionsfunktion wäre die Umsetzung von z.B. Podcasts möglich. Hat jemand Erfahrungen damit, wie gut das gelingt? Oder: Gibt es irgendwo eine Demo zum Testen, damit ich es selbst ausprobieren kann?
Wie wär's mit einer anderen Demo? Liefern Sie doch mal ein Podcast der Art, was Sie beabsichtigen zu transkribieren. Die Umsetzung mit Dragon 15 veröffentlichen wir unkorrigiert. Dann wäre ein für allemal klar, ob es sich lohnt, Aufnahmen fremder Stimmen umsetzen zu lassen. Gruß, Pascal
Zitat von P.RochWie wär's mit einer anderen Demo? Liefern Sie doch mal ein Podcast der Art, was Sie beabsichtigen zu transkribieren. Die Umsetzung mit Dragon 15 veröffentlichen wir unkorrigiert. Dann wäre ein für allemal klar, ob es sich lohnt, Aufnahmen fremder Stimmen umsetzen zu lassen.
Gute Idee, Pascal! Ich habe den Test soeben gemacht, und zwar:
(1) Ein neues Profil in DPI 15 angelegt, dabei die Option gewählt, dass das Profil zur Umsetzung einer fremden Stimme verwendet werden soll. Dabei handelt es sich dann wohl um ein "generisches" Sprecher(in)-Profil, da keine Audio-Anpassung mittels Mikrofon ausgeführt wird, und auch kein Mikro vorhanden ist.
Thema: "Wann haftet man für illegale Nutzung?" (2:34 Min.)
(3) Beim Start der Umsetzung wurde gemeckert, dass das Audioformat (MP3) nicht in Ordnung ist, also habe ich die Datei mittels Audacity in eine WAV-Datei (Mono) umgewandelt und dann umgesetzt, wobei ich die Option "Kommas und Punkte automatisch einfügen" gewählt habe.
Hier das Ergebnis:
ZitatWDR 2 Quintessenz und ein Hacker knackt das WLAN Passwort und läd illegal Filme hoch. Das kommt ja schon mal vor. Jetzt hat die Frau, deren Netz gehackt wurde. Kein eigenes WLAN Passwort genommen, sondern dass das der Internetanbieter vor eingestellt hatte und so ein Fall ging es gestern vom Bundesgerichtshof. Der Anwalt eines Filmunternehmens forderte von der Frau 750 €. Wolfgang Landmesser ist da wieder zwei Wirtschaft. Das kann sie alle betreffenden Symptome genauer drauf, was selber da genau los. Die Frau hatte einfach den 16-stelligen Schlüssel, der auf dem Router steht nicht geändertes kennen ja sicher viele. Das ist eine Kombination aus Buchstaben und Zahlen. Der sogenannte Wikipedia, zwei Schlüssel und da ist es eben diesem Hecker gelungen, den Code zu knacken, knacken und illegal ein Actionfilm auf einer Tauschbörse hoch zu laden und dann bekam die Frau im Post eine Abmahnung vom Anwalt des Inhabers der Filmrechte und die Filmfirma, die hat gesagt, sie hätte das vorangestellte Passwort durch ein individuelles ersetzen müssen, weil ich sicher genug. O. k., was hatte Bundesgericht so gesagt die abgesagte Frau trifft Eich keine Schuld, denn die konnte davon ausgehen, dass ihr WLAN gesichert ist. Mit diesem 16-stelligen Passwort und dann stellte sich hinterher erst noch raus. Das Essen Problem spezielle Probleme der Verschlüsselung gab der Internetprovider hatte unsichere Codes generierter stellte sich aber erst heraus, nachdem der Hecker zugeschlagen hatte. All das hat der BGH das konnten die Verbraucherinnen wirklich nicht wissen. Deswegen muss ja nicht bezahlen. O. k., sind die Verbraucher Richtiges gestärkt. Ich gebe zu, ich hab's auch nicht geändert, da da ja sehr schnell auf einen Sonntag auch. Ja ja ja, wir müssen sonnig ändern, lassen alle, ich werde das jetzt auch mal angehen und 60-stellige Code ändern, denn hier ist glimpflich ausgegangen, es auch gut zu wissen, dass er eigentlich reicht rechtlich, wenn sowas passiert man der angegangen wird. Das passierte relativ häufig das Firmen ein, dann abmahnen, aber Verbraucherschützer raten trotzdem das gleich erst riskieren, das sowas passiert, und sie dann eigenes Passwort zu vergeben, und das sollte natürlich sicher sein, nicht der der Name von den Kindern von der Frau soll eine Kombination aus Zahlen, Buchstaben und Sonderzeichen. Und meistens wird einander auch angezeigt. Von dem Programm, ob es unsicheres Paradies, aber nicht alle Schnucki Mausi Titel Hasi bei uns nie, nicht durch Makkaroni oder gar nicht wirklich WDR 2 DE hat kein Sonderzeichen, aber es ist eher unsere Internetadresse und da gibt's das alles noch mal zum Nachlesen. Weitere Angebote zum downloaden und mehr Informationen auf WDR 2. Die
Also für mich sieht das aus wie eine in Taiwan ins Deutsche übersetzte Bedienungsanleitung.
_______________________________________
Dragon Professional 16 auf Windows 10 Pro und Windows 11 SpeechMike Premium (LFH3500); Office 2019 Pro + Office 365 (monatliches Abo) HP ZBook Fury 17 G8 - i7-11800H - 24 MB SmartCache - 32 GB RAM - 1 TB SSD
Zitat von R.Wilkedie abgesagte Frau trifft Eich keine Schuld
Wunderbra! :)
Zweifel los! Allerdings, angesichts der vielen lapsus linguae bin ich mir nicht sicher, was mein persönlicher Favorit ist. Man darf auch nicht vergessen, dass beim dem Gespräch ausgebildete Radiosprecher beteiligt sind, die für einen noch relativ zivilisierten Sender arbeiten. Würde man dagegen Aufzeichnungen von Leuten umsetzen, die weniger strukturiert und artikuliert sprechen, wäre die Methodik sicherlich eher fragwürdig.
_______________________________________
Dragon Professional 16 auf Windows 10 Pro und Windows 11 SpeechMike Premium (LFH3500); Office 2019 Pro + Office 365 (monatliches Abo) HP ZBook Fury 17 G8 - i7-11800H - 24 MB SmartCache - 32 GB RAM - 1 TB SSD
Zitat von R.Wilke...angesichts der vielen lapsus linguae bin ich mir nicht sicher, ...
Und ich bin mir nicht so sicher, ob nicht noch ein lapsus linguistae hinzukommt. Als jemand, der selbst zwischen Wissenschaft und Praxis pendelt, wäre ich - ganz hypothetisch - erstaunt, wenn Computerlinguistik wissenschaftlich betrieben würde, ohne Dragon für die eigene Arbeit zu nutzen.
"Waarover men niet praaten kan, daarover moet men zwijgen"
_______________________________________
Dragon Professional 16 auf Windows 10 Pro und Windows 11 SpeechMike Premium (LFH3500); Office 2019 Pro + Office 365 (monatliches Abo) HP ZBook Fury 17 G8 - i7-11800H - 24 MB SmartCache - 32 GB RAM - 1 TB SSD
ZitatL.W. schrieb: "Meine Sätze erläutern dadurch, dass sie der, welcher mich versteht, am Ende als unsinnig erkennt, wenn er durch sie – auf ihnen – über sie hinausgestiegen ist.“ (6.54)
Hallo zusammen, kommen wir von den Abschweifungen mal wieder zurück zum Kern der Angelegenheit. Da von mir die Anregung kam, will ich auch noch einen Versuch beisteuern, nämlich die Aufzeichnung einer Einführungs-vorlesung an der HU Berlin http://waste.informatik.hu-berlin.de/leh...itschnitte.html. Vor kurzem erst kam ja im Forum die Frage, ob man mit Dragon auch Vorlesungsmitschnitte umsetzen lassen könne (mit welchem Hintergedanken auch immer...). Im Gegensatz zu Rüdigers Beispiel, das außerdem noch mit Musik beginnt, spricht hier nur 1 Person.
Hier ein Ausschnitt des Ergebnisses:
ZitatInformatik und Informationsgesellschaft ein digitaler Medien 1. Vorlesung Einführung gehalten am 24.10.2006 von Jochen Q Beck an der Humboldt-Universität zu Berlin die Veranstaltung als Informatik und Informationsgesellschaft Teil 1 Für dieses Semester Teil 2 finden im Sommersemester sprechen statt die beiden Veranstaltung gehören zusammen, kann die eine oder die andere hören aus so verlieren daraus vertieft sich gegenseitig zunächst halt die folgenden tätig von übertragenden Bild und Ton gespeichert Speicherung ist eine Sache machen wenn ich nicht regelmäßig aber verschwand Tonaufnahme wird aber gespeichert als wenn ihr Fragen habt wenn ich mit aufgenommen und später dann auch zur Verfügung gestellt soll nur klaren dieses Mikrofon tatsächlich auch das hatte sie es für die Prüfungsvorbereitung später benutzen also wir stellen die Folien und die Audiomitschnitte zeitnah zur Verfügung zu der nicht mitschreiben müssen gerne schreiben aber insofern nicht notwendig weil wir halt dann so gut wie möglich aufzeichnen das wäre jetzt von Silvester verschließt den Kreis im Sommer geht stark an die gesellschaftlichen Aspekte also die Fragen Informationsgesellschaft das wäre jetzt die Wiederholung bzw. Einführung was versteht man unter Informationsgesellschaft ist ein sehr großer Begriff sehr seit vielen Jahrzehnten so die verschiedenen Wissenschaften durchdringt da keine ab endgültige Definition der Weine die das Recht zusammenfasst von der UNO in und da versteht man unter Informationsgesellschaft eine globale vernetzte Gesellschaftsformsation in der Produktion Distribution recht und andere Subsysteme überwiegend von der Zeugungsbeschaffungsspeicherung Übertragung und maschinellen Bearbeitung von Daten Informationen abhängen wie sich das daraus buchstabierter verweise ich auf andere Veranstaltungen die Charakteristik einer Informationsgesellschaft im Globalisierung nicht auf eine Nation bezieht sondern letztendlich global wirkt dann die E und K Technologien und Medien darüber jetzt tatsächlich im Schwerpunkt dieser Vorlesung muss halt um Medien gehen wird auf Dezentralisierung nach den
Alles verstanden?
Fazit: Der Aufwand, die Beiträge in verständliches Deutsch zu übertragen, übersteigt jedes Maß. Man muss sie sich noch mal komplett anhören und korrigieren (nicht, damit Dragon lernt - das ist sowieso unnötig, da die "fremde Stimme" immer wechselt). StattKorrektur ist ein "Echo"-Diktat (Meinhard) viel sinnvoller. Und nicht zuletzt muss immer dann für für jedes fremde Diktat ein neuer Benutzer angelegt werden. Also Leute, lasst alle Hoffnung auf bequeme und unaufwendige Umsetzung fremder Diktate fallen. Ich meine, wir brauchen auch das Forum mit diesem Thema nicht länger zu bemühen. Gruß, Pascal
Zitat von P.RochIch meine, wir brauchen auch das Forum mit diesem Thema nicht länger zu bemühen.
Ja, können wir machen, das Thema aber als Referenz aufbewahren, wenn die Frage danach wieder aufkommt, vermutlich in spätestens 1-2 Monaten.
Aber warum hast Du denn nicht eingestellt, dass Kommas und Punkte automatisch eingefügt werden? - Dann hätte man doch alles verstanden, oder?
_______________________________________
Dragon Professional 16 auf Windows 10 Pro und Windows 11 SpeechMike Premium (LFH3500); Office 2019 Pro + Office 365 (monatliches Abo) HP ZBook Fury 17 G8 - i7-11800H - 24 MB SmartCache - 32 GB RAM - 1 TB SSD
Zitat von R.WilkeAber warum hast Du denn nicht eingestellt, dass Kommas und Punkte automatisch eingefügt werden? - Dann hätte man doch alles verstanden, oder?
Ganz einfach - ich habe mit der Version 14 (Individual) umsetzen lassen. Beim Einrichten der Umsetzungsquelle werden in der 14 einige Sekunden vorab umgesetzt und das Ergebnis angezeigt - zu Trainingszwecken sozusagen. Man kann dieses Ergebnis noch korrigieren, was gelegentlich einen (geringen) Gewinn brachte. In der 15 hat Nunace auch darauf verzichtet, dafür die unkt/Komma-Geschichte ins Spiel gebracht. Ohne weiteren Kommentar hier noch die Umsetzung mit Version 15 (neues Profil):
ZitatInformatik und Informationsgesellschaft eins digitale Medien erste Vorlesung Einführung gehalten. Am 24. Oktober 2006 von Jochen Kubica an der Humboldt-Universität zu Berlin. Die Veranstaltung heißt Informatik und Informationsgesellschaft Teil eins Halbkurs über dieses Semester Teil Zweifel in deinem Sommersemester entsprechend statt. Die beiden Veranstaltung gehören zusammen. Aber man kann die eine oder die andere hören Auto, sofern ich am Rande aus. Alles vertieft sich gegenseitig zunächst halt die folgenden tätigen von übertragenden Bild und Ton gespeichert. Der Bildspeicherung des ist eine Sache, das machen wir nicht regelmäßig, aber später will Weizmann die Tonaufnahme wird aber gespeichert, als wenn ihr Fragen habt Benehmen aufgenommen und später dann auch zur Verfügung gestellt. Das soll ich nur Klasen dieses Mikrofon Zeichen tatsächlich auf das interessante ist, ihr könnt es für die Prüfungsvorbereitung später benutzen. Also wir stellen die Folien und die Audiomitschnitte zeitnah zur Verfügung, sodass sie feindlich mit Schreiben müsst ihr könnt gerne mitschreiben, aber das ist insofern nicht notwendig, weil wir halt so gut wie möglich aufzeichnen. Das wäre jetzt im Prinzip ist das verschließt den Kreis im Sommer Windstärke um die gesellschaftlichen Aspekte, also die Frage Informationsgesellschaft. Das wäre jetzt die Wiederholung bzw. Einführung, also was versteht man unter Informationsgesellschaft ist sehr großer Begriff, der seit vielen Jahrzehnten sollen die verschiedenen Wissenschaften durchdringt, da keine Abendgage definitionem eine, die das rechtlich zusammenfasst, es von der UNO in und da versteht man unter Informationsgesellschaft eine globale vernetzte Gesellschaftsformation in der Produktion, Distribution, rechts und andere Subsysteme überwiegend von der Erzeugung, Beschaffung, Speicherung, Übertragung und maschinellen Bearbeitung von Dateninformationen abhängen, wie sich das dann aus buchstabierter verweise ich auf andere Veranstaltungen die Charakteristika einer Informationsgesellschaft ist eben Globalisierung, das sich nicht auf eine Nation bezieht, sondern letztendlich global wirkt dann die E und K Technologien und Medien. Da sind bereits tatsächlich im Schwerpunkt dieser Vorlesung muss
Das Ergebnis sieht wohl etwas besser aus. Komma- und Punkt-Setzungen sind hin und wieder sogar richtig, auch angesichts falschen Textes. Ich würde mir den Aufwand der Umsetzung trotzdem sparen und Echo-Diktieren. Die Dauer der Umsetzung betrug übrigens ca. 25 min. Die .dra-Dateien der 14er und 15er unterscheiden sich interessanterweise - die 15er ist etwa doppelt so groß (andere Bitrate).
So weit so gut. Selbstverständlich sollte dieser Thread als Referenz weiterleben.
Gruß, Pascal
Ach ja: Ich halte es für möglich, dass die Transkription englischsprachiger Podcasts bessere Ergebnisse bringt und deshalb die Nuance-Werbeaussage nicht völlig aus der Luft gegriffen ist.
Meine Frage, warum Du denn nicht die automatische Interpunktion verwendet hast, war ironisch zu verstehen...
Es scheint als hast Du, trotz Deiner Exil-Jahre am Niederrhein, unseren leicht(fertig)en Fabulierdrang dann doch nicht ganz verinnerlicht. Oder vielleicht sollte ich im Ganzen meine Beiträge doch mehr überregional orientiert verfassen.
In der Sache: auch die Verwendung der automatischen Interpunktion macht aus der Methodik nicht mehr als reine Spielerei. Der Aufwand, um aus der Umsetzung ein brauchbares Ergebnis zu machen, ist sicherlich nicht geringer als den Text nochmal neu zu erstellen, mit welcher Technik auch immer.
Wozu die Umsetzung allenfalls dienen kann, erinnert mich an das, was unser Altgriechisch-Lehrer zu den, bei Schülern in Not allzeit beliebten, Übersetzungen der lateinischen und griechischen Klassiker zu sagen pflegte: man kann sich damit im besten Fall darüber informieren, ob es sich beim Originaltext um ein Kochrezept oder um die Beschreibung einer antiken Schlacht handelt. Und nota bene, der Mann war auch ein Rheinländer.
Bis die Technik so weit ist, dass aufgezeichnete Sprache jeglicher Provenienz brauchbar umgesetzt werden kann, müssen diverse Spracherkenner-Generationen erst noch das Licht der Welt erblicken, ist mein Verdacht.
_______________________________________
Dragon Professional 16 auf Windows 10 Pro und Windows 11 SpeechMike Premium (LFH3500); Office 2019 Pro + Office 365 (monatliches Abo) HP ZBook Fury 17 G8 - i7-11800H - 24 MB SmartCache - 32 GB RAM - 1 TB SSD
Ich hatte mich schon vor Jahren gefragt, wie eigentlich die Live-Untertitel ins Fernsehen kommen. Anlass war ein Fernsehinterview mit einem unserer großen Bosse, das wir im Unternehmen per Liveübertragung anschauten, und das in Echtzeit mit Untertiteln lief. Ich fragte, wie man es hinbekam, dass im Moment des Sprechens bereits die Transkription auf dem Bildschirm war, und man sagte mir damals, sowohl vom Reporter als vom Chairman gäbe es fertige Sprachmodelle, die es ermöglichten, deren Aussagen, unterstützt durch entsprechende Rechenleistung im Hintergrund, per Spracherkennung sofort auf dem Bildschirm zu bringen. Ich blieb allerdings bezüglich dieser Aussage skeptisch.
Ich denke mal, das lief genauso ab, wie in den Fernsehanstalten. Wen es interessiert, der kann sich das einmal anschauen:
War für mich sehr interessant, man lässt also die Spracherkennung den Text nicht direkt erkennen. Man nutzt vielmehr das sogenannte Re-Speaking, d. h. Angestellte des Fernsehens sprechen in Echtzeit den gehörten Text nach und lassen ihn von der Spracherkennung auf den Bildschirm schreiben, dabei sollen sie schnell genug sein, per Tastatur noch Korrekturen einzuarbeiten. Leider habe ich nirgendwo einen Hinweis gefunden, welche Spracherkennung genutzt wird, denke aber, das wird Dragon sein, mir ist jedenfalls kein Konkurrenzprodukt bekannt, dass es ebenso und vielleicht sogar besser leisten könnte.
Bezüglich eines Podcasts wurde das hier ja bereits erwähnt: man müsste ihn über Kopfhörer hören und nachsprechen.
DNS 15.3 Professional Individual auf Windows 10 Home (64-bit) Plantronics PLT Savi W440 Intel (R) Core (TM) i7-7500 2,7 GHz 8 GB RAM 64 Bit