Sie sind vermutlich noch nicht im Forum angemeldet - Klicken Sie hier um sich kostenlos anzumelden Impressum 
Sie können sich hier anmelden
Dieses Thema hat 4 Antworten
und wurde 381 mal aufgerufen
 Fragen zur Anwendung
AxelW Offline



Beiträge: 24

07.11.2020 21:39
Erfahrungen mit Amazon Transcribe, Google Speech... Zitat · Antworten

Liebe Dragon-Nutzer,

es ist mir schon klar, dass meine Frage etwas "off-topic" ist, aber viele Dragon-Nutzer wird sie sicher trotzdem interessieren, so dass ich sie hier mal im Forum stellen möchte:
Hat mal jemand die deutsche Version von Amazon Transcribe (Cloud-Spracherkennung von Amazon) bzw. die Cloud-Spracherkennung von Microsoft ausprobiert? Falls ja, lässt sich damit eine zufriedenstellende, eventuell mit Dragon 15 vergleichbare Spracherkennungsqualität erzielen?

Um Mißverständnisse zu vermeiden: Ich bin zufriedener Dragon-Nutzer. Ich bevorzuge für die tägliche Tätigkeit auch weiter ein auf meinem Rechner lokal vorhandenes Programm. Für gewisse Zwecke brauche ich allerdings eine zweite Spracherkennung, bei der sich der Sprachkontext flexibel (für jeden einzelnen Satz) ändern lässt. Außerdem brauche ich Zeitstempel für einzelne Wörter. Ich könnte natürlich ein Konto bei AWS oder Microsoft Azure einrichten, einige kleine Programme schreiben und dann selbst ausprobieren, welche Ergebnisse sich damit erzielen lassen. Aber eventuell hat hier ja bereits jemand Erfahrungen gesammelt, die er mitteilen möchte.

Die Cloud-Spracherkennung von Google habe ich bereits getestet. Ich denke, dass es hier von Interesse ist, meine Ergebnisse mitzuteilen: Bei entsprechender Customisierung, d.h. flexibler Festlegung des Sprachkontexts für einzelne Sätze, kann man damit schon eine beachtliche Genauigkeit erhalten, die allerdings nicht an Dragon 15 heranreicht. Ohne genauer Vorgabe des Sprachkontexts ist die Erkennungsrate bei wenig gebrauchten technischen Begriffen eher schlecht. Durch Vorgabe eines Sprachkontexts kann man die Erkennung jedoch erheblich verbessern. Ich habe allerdings festgestellt, dass da noch Fehler im Cloud-Speech-System von Google existieren, so dass die "timestamps", also die Zeitmarken der einzelnen Wörter falsch sind, sowie man einen "speech context" vorgibt. Ich habe den Fehler bereits an Google gemeldet und hoffe, dass er dann bald behoben wird. Dazu ist zu sagen, dass die Vorgabe des Sprachzusammenhangs lediglich als Betaversion implementiert ist.

Beste Grüße

Axel W.

hwy2001 Offline




Beiträge: 61

08.11.2020 19:06
#2 RE: Erfahrungen mit Amazon Transcribe, Google Speech... Zitat · Antworten

Hallo Axel W.,

Herzlichen Dank für den Bericht! Auch ich bin seit langem schon mit Dragon zufrieden bis sehr zufrieden. Angesichts der exorbitanten Preissteigerungen muss ich mich aber rechtzeitig umsehen, was ich mir auch später noch leisten können werde.

Um es klar zu sagen: ich finde Dragon vom Preis-Leistungsverhältnis hervorragend, bis – eben – vor kurzem. Wenn ich mich recht erinnere, eine Verdreifachung oder noch mehr beim Preis.

Cloud-Lösungen widerstreben mir extrem, weil so gut wie fast jeder mit ein wenig technischem Verständnis mithören kann, soweit ich das sehe.

Von den immer wieder auftauchenden, hoffentlich haltlosen, Gerüchten, Nuance würde es nicht gut gehen ganz abgesehen, kommt mir vor, dass sich die Verbesserungen von Dragon eher geringfügigen Bereich bewegen. Insgesamt liegen jedoch zweifellos erkennbare Fortschritte vor, ich verwende Dragon seit Version 9 regelmäßig.

Was ich mir besonders wünschen würde ist, dass ich von Deutsch auf Englisch/Amerikanisch umschalten könnte, da fremdsprachige Zitate oder Passagen heutzutage in vielen Bereichen unbedingt erforderlich sind. Wie sieht das bei Amazon und Google aus?

Liebe Grüße hwy2001

DPI 15.3
Win11 Home 64bit
Core i9-11900H 2,5Ghz 16GB RAM SSD 1TB
Logitech H800 BT Headset

AxelW Offline



Beiträge: 24

08.11.2020 21:27
#3 RE: Erfahrungen mit Amazon Transcribe, Google Speech... Zitat · Antworten

Hallo hwy2001,

ich habe auch eine gewisse Aversion gegen Cloud-Lösungen, und bei manchen meiner Arbeiten darf ich diese auch gar nicht verwenden, weil ich damit gegen Kundenvorgaben in Hinblick auf Geheimhaltung verstoßen würde.

Mit Amazon Transcribe habe ich noch nicht explizit gearbeitet. Ich habe nur mal grob die Dokumentation gelesen. Im Wesentlichen gibt es da wenig Unterschiede zu Google-Cloud-Speech, das ich bereits selbst getestet habe. Das flexible Festlegen der Sprache ist dabei überhaupt kein Problem. Man kann das System auf verschiedene Arten ansprechen. Da ich mit Deep Learning arbeite und meistens mit Python programmiere, habe ich Python dafür verwendet. Man kann aber auch alle möglichen anderen Programmiersysteme in der Art von Java, C, REST... verwenden. Die Dokumentation ist sehr gut und man erhält Zugriff auf zahlreiche Beispielprogramme für verschiedene Problemstellungen.

Die Spracherkennungsaufträge kann man dabei so feinkörnig wie gewünscht absenden. Im Prinzip kann man sogar einzelne Wörter erkennen lassen. Allerdings zahlt man bei jeder Anfrage mindestens für 15 Sekunden. Danach ist die Gebühr dann einfach proportional zur Dauer der übersendeten Audiodateien bzw. des Streaming Audios. Und um auf die Frage nach der Sprachfestlegung zurückzukommen: Dies ist einfach ein Parameter "language_code='de-DE'" für Deutsch bzw. entsprechend für andere Sprachen.

Das ist eben der Vorteil bei so einem Cloud-System: Man kann so gut wie alles konfigurieren. Für mich sind beispielsweise Zeitmarken, Erkennungsalternativen und Konfidenzwerte interessant (neben der flexiblen Festlegung des Kontexts, wie bereits erwähnt).

Die Microsoft-Azure-Spracherkennung erscheint mir auch vielversprechend. Da kann man sogar eigene akustische Modelle und Sprachmodelle trainieren und hinterlegen. Aber trotz intensiver Suche habe ich nicht viel an Erfahrungsberichten aus dem deutschsprachigen Raum gefunden.

Vielleicht will ja doch noch jemand aus dem Forum etwas dazu sagen, der dies schon einmal angetestet hat. Eventuell nehme ich mir sonst auch noch mal ein paar Tage Zeit, richte Konten bei Azure bzw. bei AWS ein und teste diese eingehender.

Beste Grüße

AxelW

Harald Offline



Beiträge: 380

09.11.2020 22:16
#4 RE: Erfahrungen mit Amazon Transcribe, Google Speech... Zitat · Antworten

Früher habe ich Swype genutzt, aber das wird ja schon seit Ewigkeiten von Nuance nicht mehr weiter entwickelt. Und mittlerweile ist auch die Cloud Speicherung des eigenen Vokabulars stillgelegt. Daher nutze ich auf dem Smartphone für WhatsApp, eigentlich bei allen anderen Texteingaben auch, die Google Spracheingabe. Die Erkennungsgenauigkeit ist mittlerweile wirklich sehr gut, zumal im Unterschied zu dem Drachen die Erkennung ganz offensichtlich kontextsensitiv vorgenommen wird. Wenn ich zum Beispiel einen Text über Azubis eingebe, dann schreibt die Google Spracherkennung möglicherweise zuerst, falls das Wort in meinem Text vorkommt, Leere, aber nach einer kurzen Zeit sieht man, wie dieses Wort in Lehre umgewandelt wird. Was mich allerdings sehr stört, dass es im Deutschen so gut wie keine Sprachkommandos gibt. „Klammer auf" zum Beispiel geht noch, ebenso „Komma" oder „Punkt" oder „Gänsefüßchen". Aber bei (zum Beispiel) „neue Zeile" oder „neuer abssatz" oder auch die erzwungene Großschreibung - dies alles funktioniert im Deutschen nicht. Außerdem habe ich festgestellt, dass im Unterschied zum Drachen es bei Google hilfreich ist, wenn man langsam spricht und die Worte sehr deutlich trennt. Wohingegen beim Drachen ja die Erkennungsgenauigkeit üblicherweise zunimmt, wenn man flüssig und in einem Satz spricht.

Die Microsoft Spracherkennung nutze ich hingegen so gut wie gar nicht. Auf meinem Surface habe ich mehrfach versucht, mich damit einzurichten, aber die Genauigkeit ist gefühlt sehr schlecht und erfordert viele Korrekturen.

DNS 15.3 Professional Individual auf Windows 10 Home (64-bit)
Plantronics PLT Savi W440
Intel (R) Core (TM) i7-7500 2,7 GHz 8 GB RAM 64 Bit

AxelW Offline



Beiträge: 24

10.11.2020 13:28
#5 RE: Erfahrungen mit Amazon Transcribe, Google Speech... Zitat · Antworten

Die Google-Spracheingabe verwendet tatsächlich ein Sprachmodell (laut Dokumentation), das ohne weitere Anpassung bei Spezialausdrücken allerdings nicht gut funktioniert. Dies ist bei der generellen Spracherkennung, die Online verfügbar ist, ja auch nicht anders zu erwarten. Über die Cloud-Speech-API kann man dann beliebig Kontexte und sogar Verstärkungswerte für einzelne Begriffe (boost values) festlegen, welche die Erkennungsrate erheblich verbessern. Dies habe ich wie gesagt bereits eingehend für meine Zwecke (sehr technische Texte mit vielen Spezialausdrücken)getestet.

Die generelle Spracherkennung, die Microsoft ja auch online zur Verfügung stellt, liefert auch keine viel besseren Ergebnisse, was ich auch nicht erwartet hatte. Amazon Azure stellt, soweit mir bekannt ist, keine einfache Online-Möglichkeit bereit, die Spracherkennung zu testen (außer natürlich wenn man sich so eine Alexa-Wanze ins Haus stellt). Hier gibt es wirklich nur den Zugang über die Cloud-Dienste.

Um diese Cloud-Services mit den dort gegebenen zahlreichen Konfigurationsmöglichkeiten nutzen zu können, muss man leider schon etwas programmieren können. Im Prinzip ist das alles kein großes Problem, aber einige Stunden gingen bei mir dann doch bei meinen Google-Cloud-Speech-Aktivitäten ins Land. Man muss eben doch so einige Einstellungen an den Programmen vornehmen, Cloud-Buckets einrichten, die Kommunikation mit dem eigenen PC programmieren... Nun gut, vielleicht nehme ich mir dann bei Gelegenheit doch noch mal einige Stunden Zeit, insbesondere, um die Cloud-Spracherkennung von Microsoft anzutesten, die auch eine Audio-Sprecheradaptation zulässt.

Ähnliche Themen Antworten/Neu Letzter Beitrag⁄Zugriffe
Erfahrung mit Dragon Professional 16.1?
Erstellt im Forum Fragen zur Anwendung von AI
3 13.02.2024 18:41
von AI • Zugriffe: 444
Dragon Legal 16 – erste Erfahrungen
Erstellt im Forum Berichte und Tipps von Marius_
4 29.03.2023 17:27
von royaltyrant • Zugriffe: 1079
E-mail - WhatsApp - Google
Erstellt im Forum Fragen zur Anwendung von Jack-The-Ripper
6 30.01.2023 16:04
von Marius_ • Zugriffe: 213
Letzte Rettung
Erstellt im Forum Dies und Das von Dioskur
0 19.11.2022 16:14
von Dioskur • Zugriffe: 242
Zukunft von Dragon
Erstellt im Forum Dies und Das von Marius_
2 28.10.2022 12:02
von HalbMenschHalbKeks • Zugriffe: 811
Erfahrung mit drahtlosem Bone Conductive Headset?
Erstellt im Forum Geräte und Hardware von dummefragenstell
1 13.07.2022 19:58
von rc.otto • Zugriffe: 213
Vorlese-Geschwindigkeiten ändern.
Erstellt im Forum Fragen zur Anwendung von Anton Rodenhauser
10 10.02.2022 20:46
von Anton Rodenhauser • Zugriffe: 283
Speech starting to probable edit control - Drache hängt
Erstellt im Forum Fragen zur Anwendung von JanBob
3 15.09.2021 15:40
von P.Roch • Zugriffe: 663
Verbindung mit Google Docs funktioniert nicht
Erstellt im Forum Fragen zur Anwendung von SuperTerra
1 23.08.2021 14:11
von P.Roch • Zugriffe: 334
Hat irgendjemand Infos/Erfahrungen mit Dragon 13 Premium/15 DPI und Windows 11?
Erstellt im Forum Fragen zur Anwendung von Khaine
1 07.12.2021 15:01
von Falconi • Zugriffe: 1355
 Sprung  
Xobor Ein Kostenloses Forum | Einfach ein Forum erstellen
Datenschutz