Sie sind vermutlich noch nicht im Forum angemeldet - Klicken Sie hier um sich kostenlos anzumelden Impressum 
Sie können sich hier anmelden
Dieses Thema hat 3 Antworten
und wurde 30 mal aufgerufen
 Berichte und Tipps
oguh Offline



Beiträge: 64

31.03.2010 07:00
RE: Was von vornherein unmöglich ist... Zitat · Antworten

Unter "Spracherkennung versus Schreibkraft" wurden die Grenzen der Software bereits angesprochen, jedoch ist dieses Thema für die effiziente Handhabung des Programms und damit eine vertiefte Erörterung mehr als bedeutungsvoll genug.

Die Software kann und wird nicht fehlerfrei schreiben, was nicht im aktiven Vokabular enthalten ist, entweder ursprünglich oder hinzugefügt![*1] Da helfen auch perfektes Artikulieren, Modelloptimierung, zusätzliches Training, die Analyse des Schreibstils... nichts.

Dieses Vokabular umfasst 150.000 Wörter (plus benutzerdefinierte), wovon die meisten mit mehreren Formen vertreten sind, so dass geschätzt nur 50.000 verschiedene Wörter enthalten sind.

Das ist eher wenig. Noch wesentlicher aber die Berücksichtigung der Formen, die zum Einzelwort zur Verfügung gestellt werden, denn das ist meist nur ein Bruchteil derjenigen, die es jeweils gibt.

Beispiele:

Drin sind lallen und lallt, aber sonst zu diesem Wort nichts. Das heißt, das Diktat von lalle, lallst, lallende/n, gelallt/e/n...[*2] führt zwangsläufig zu Fehlern.

Viele Varianten dagegen bei denken; denke, denkst, denkt, dachte, dachtest, dachten, denkend/e/n, gedacht/e/n. Nicht enthalten ist dachtet, denkendem und gedachtem.

Bei ficken nur der Infinitiv, kein ficke, fickst, fickt, fickte, gefickt.

Sehr komfortabel die Ausstattung bei länger, längere, längeres, längeren und längerem; alles drin. Aber bei kürzer fehlt mit kürzerem das Pendant.

Umgekehrt kommt dagegen "lang" im Superlativ zu kurz: kürzestem ist enthalten, aber kein längstem.

Nicht komplett auch der Genitiv: Tisches, Glases, Betrugs und Betruges (sogar zwei Formen!) und Stempels ist drin, aber nicht Tuches, Schwanzes. Moskaus und Münchens wird bereitgestellt, aber nicht Starnbergs, Oberhausens und Hunzikers, obschon in der Grundform alles drin.

Getüncht, getünchte, getünchten, getünchtes ist drin, nicht aber getünchter, obwohl sich dieses Wort sogar in den Trainingsgeschichten findet, wie z.B. auch stemmende, und mit diesen Texten suggeriert der Softwarehersteller eine tatsächlich nicht mögliche Ausdrucksqualität.

Summa summarum stellt der gelieferte Wortschatz eine in Relation zu seiner Größe kaum zu kritisierende Auswahl aus dem Repertoire der deutschen Sprache dar, aber eben doch nur eine Auswahl.

Für mich habe ich danach Diktatregeln bezüglich der Wortwahl aufgestellt:

  1. Keine Adjektive oder Partizipien mit -m am Ende.[/*]

  1. Kein Imperfekt, nur Perfekt.[/*]
  1. Konjunktiv nur über "würde".[/*]
  1. Verben tunlichst in der dritten Person Singular oder im Infinitiv. Ich-Form vermeiden.[/*]
  1. Partizip Präsens allenfalls bei absoluten Alltagswörtern wagen.[/*]
  1. Restriktiver Gebrauch auch des Partizip Perfekt, aber weniger als des Präsens.[/*]

  1. Komparativ wie Partizip Präsens und Superlativ wie Partizip Perfekt.[/*]
  1. Standardwörter bevorzugen (und gewünschte/notwendige andere ins Vokabular aufnehmen[*3]).[/*]
  1. Auch bei Substantiven die Grundform (Nominativ) bevorzugen; bereits der Genitiv birgt Fehlergefahren.[/*]
  1. Texte abfassen, als wären sie für die Bild-Zeitung, denn größer ist der Wortschatz der Software kaum.[/*]

Die in der Werbung genannte Erkennungsgenauigkeit von fast 100 % ist zwar realistisch, aber ausschließlich, soweit Wörter und Wortformen verwendet werden, die im Vokabular enthalten sind. Andernfalls bricht sie dramatisch und frustrierend ein.

Auf die Qualität des Diktats komme es an, wird immer herausgestrichen. Hinzuzufügen ist, dass diese bei Verwendung von DNS mehr noch darin besteht, dass der Software entsprechend formuliert wird, wobei es gerade dem Anfänger einiges an zusätzlicher Konzentration abverlangt, die Möglichkeiten nicht zu überschreiten und trotzdem noch ordentlich zu äußern, was eigentlich gesagt werden soll.

"Dragon zu sprechen"[*4] ist der beste Rat, den ich zu dieser Software nach mehr als 5000 h des Gebrauchs geben kann. Geprüft werden kann er, indem beim Auftreten von Fehlern im Vokabular nachgesehen wird, ob das Wort/die Wortform enthalten ist und nach "streich das" unter Verwendung des Vokabularbestands neu diktiert wird. Das sollte dann klappen, wenn sonst nichts im Argen liegt.

Die meist kommerziell motivierten Propagandisten, die von den engen Grenzen des Produkts und seiner herben Gewöhnungsbedürftigkeit nichts wissen wollen, seien vertröstet, dass die Hardwarefortschritte dem Unternehmen Nuance gewiss Veranlassung sein werden, die Software auch künftig zu ertüchtigen, sei es durch Ausweitung des Vokabulars oder Implementierung einer (hoffentlich schaltbaren) Wortformen-Ergänzungsfunktion.

Zu vorstehenden Fakten noch mein kleiner persönlicher Aberglaube, dass bereits nach wenigen nicht erkannten und dann korrigierten Wörtern der Drachen derart verunsichert ist, dass er für den Rest des Tages zu gewohnter Leistung nicht mehr in der Lage ist. Ich trage daher das Sensibelchen nicht nur auf Händen, sondern auf der Zunge.


Fußnoten:
[*1] oder durch Kompositabildung/Verbindungsbefehle erstellt wurde.
[*2] Kursives ist nur durch manuelles Tippen oder Korrektur produzierbar.
[*3] Was dann aber mit allen benötigten Formen dieses Worts geschehen sollte.
[*4] Quelle des Gags: http://www.nuance.de/dragonstories/

DNS 11 Prof - Win7/64 Ultim - Intel Xeon W3520/12 GB - SSD Intel 160 GB

R.Wilke Offline



Beiträge: 6.117

31.03.2010 19:27
#2 RE: Was von vornherein unmöglich ist... Zitat · Antworten

... Nichts ist unmöglich!

Vielen Dank für dieses Referat, welches zweifellos geeignet ist, ein sehr interessantes Thema zu behandeln. Vorab aber bemerkt, dass einige der hier genannten Beispiele nicht in allen Formen im Vokabular sind, habe ich bisher noch nie als Manko empfunden, insbesondere nicht bei Wörtern wie "lallen" oder bei dem Wort mit dem F. am Anfang.

Wenn man sich mit den Grenzen der Spracherkennung näher befassen will, sollte man sich zunächst einmal Gedanken über die Unbegrenztzeit der Sprache machen. Dazu erst einmal ein paar Fakten und Zahlen.

Der deutsche Wortschatz umfasst, je nach Betrachtungsweise, zwischen 350.000 und 10 Millionen Wörter. Bei Sprechern unterscheidet man grundsätzlich zwischen einem aktiven und einem passiven Wortschatz, Untersuchungen zufolge verfügen gebildete Gymnasiasten etwa über 15.000 Wörter im aktiven Wortschatz, die meisten Wörter sind nachweisbar verwendet worden mal wieder bei Goethe, das Wörterbuch zu seinen Werken umfasst etwa 90.000 Einträge. Sogar Thomas Mann brachte es auf deutlich weniger, meines Wissens etwa 60.000, und ich nehme an, das hat ihm schwer zu schaffen gemacht

Bei all diesen Zahlen sind jedoch immer nur Einträge in der jeweiligen Grundform berücksichtigt, nimmt man die flektierten Formen noch dazu, müssen die Zahlen entsprechend vervielfacht werden. Noch gar nicht darin eingerechnet ist ein weiteres, für das Deutsche zumindest wesentliches Wachstumspotential, nämlich die freie Wortbildung, wovon die Kompositabildung nur ein Teil ist. Darin erst zeigt sich die wahre kreative Kraft der Sprachen, aus endlichen Mitteln einen unendlichen Gebrauch zu machen (Wilhelm von Humboldt, leicht abgewandelt).

Demgegenüber haben wiederum Untersuchungen gezeigt, was insbesondere für den Fremdsprachenunterricht Wirkung zeigte, dass bereits mit einem relativ kleinen Bestand an Basisvokabular ein großer Teil von Standardtexten abgedeckt ist, so geht man davon aus, dass mit etwa 1000 Wörtern etwa 85 % der durchschnittlichen Texte verstanden werden kann, was mit der Häufigkeit des Auftretens dieser Wörter zusammenhängt. Dies hängt natürlich in erster Linie auch davon ab, welche Texte zu diesem Standard-Korpus gezählt werden.

Und an dieser Stelle nähern wir uns der Drachen-Problematik. Wie schon ausgeführt wurde, die Spracherkennung kann nur Wörter erkennen, die sie schon kennt, in dem Sinne also nur wieder-erkennen. Die Fähigkeiten eines, wie es in der Linguistik genannt wird, kompetenten Sprechers einer natürlichen Sprache, aus der Kenntnis einer beherrschbaren Anzahl von Elementen und Regeln, nach denen diese Elemente miteinander verbunden werden können, auch bis dahin unbekannte Einheiten zu erschließen, geht der Spracherkennung völlig ab.

Man mag nun darüber diskutieren, ob der Umfang und die Zusammenstellung des Vokabulars in Dragon NaturallySpeaking zweckmäßig ist oder nicht. Was den Umfang angeht, nach heutigem Stand mit bis zu 200.000 Einträgen im aktiven Vokabular hat sich die Technik schon sehr weit fortentwickelt gegenüber ihren Anfängen, als unter einem "großen" Vokabular ein Wortschatz mit einigen 10.000 Einträgen verstanden wurde.

Typisch aber ist, und das wurde ja schon festgestellt, dass bei den Verbformen in der Regel der Infinitiv und die 3. Person gegenüber der 1. und der 2. Person Priorität haben. Das hängt wohl damit zusammen, vermute ich, dass der zu Grunde gelegte Textkorpus, aus dem das Datenmaterial gewonnen wurde, wenig dialogisch, dafür aber mehr im Berichtsform ausgerichtet ist. Und von der Zusammenstellung der Texte hängt letztendlich auch der Wortbestand im Vokabular ab, weil es hierbei einfach um statistische Häufigkeit geht, und nicht um Geschmacksfragen, und ich würde immerhin ausschließen, dass irgendein Gremium darüber tagte, welche Wörter aufgenommen werden sollen oder nicht. Dasselbe gilt dann auch sinngemäß für die anderen hier aufgeführten Beispiele, etwa die Genitiv-Formen, die ohnehin irgendwann vielleicht ausgestorben sein werden, und alles Weitere, was hier sehr detailliert und zutreffend vorgebracht worden ist.

Jedoch, die Problematik dabei sehe ich nicht, habe ich doch die Möglichkeit, mir mein eigenes Vokabular so anzupassen, wie ich es benötige, auch wenn dies mit, zugegebenermaßen, ein wenig Aufwand verbunden ist. Womit allerdings nicht gesagt werden soll, dass das Ende der Entwicklung damit schon erreicht ist.

Viele Grüße
Rüdiger Wilke

_______________________________________

DPG 15.6 (15.60.200.015) auf Windows 10 Pro (64-bit)
SpeechMike Premium (LFH3500) + SpeechMike II
HP ZBook 17 G2 (Refurbished) - i7-4910qm - 8MB SmartCache - 32 GB RAM - 512 GB SSD - 1 TB HSSD - 2 TB HDD

Dioskur Offline



Beiträge: 511

01.04.2010 18:07
#3 RE: Was von vornherein unmöglich ist... Zitat · Antworten

Zitat von R.Wilke
Dasselbe gilt dann auch sinngemäß für die anderen hier aufgeführten Beispiele, etwa die Genitiv-Formen, die ohnehin irgendwann vielleicht ausgestorben sein werden



Hallo Rüdiger,

das klingt ja ziemlich depressiv - und das kurz vor Ostern. Umso wichtiger ist es, dass die Spracherkennungsgemeinde die Genitivformen in ihren Drachen-Wortschatz hinein rettet. Der Dativ soll nicht länger dem Genitiv sein Tod sein! Sprachverliebte, hört die Signale ...

Frohe Ostern und vielen Dank für Deine Mühe mit dem Forum!

Hans

DPI 15 auf Windows 10 Professional (64-bit)
SpeechMike Premium. Intel i7 Core 4x2.67 GHz, 6 GB RAM

Marius Raabe Offline



Beiträge: 718

07.04.2010 14:19
#4 RE: Was von vornherein unmöglich ist... Zitat · Antworten

Auch wenn ich mich wie Dioskur (hübsches Alias btw, hieß nicht auch mal ein Gegenpapst so - und was sagt uns das über die Rollenverteilung im Forum ) schon über manche fehlende Flexion geärgert habe, beobachte ich seit ca. Version 8 der Software an mir, dass ich meine sprachlichen Gewohnheiten immer weniger an die Software anpasse, sondern umgekehrt - einfach, weil auch seltene, ähnlich wie andere klingende Wortformen besser erkannt werden (auch die -m-Fälle übrigens).
Gnadenlos korrigiere ich jeden fehlenden Genitiv oder 1. Person Singular und bleibe (verhalten) optimistisch!

In allerbestem Sinne (okay, einmal korrigiert, das richtige Wort war aber in der Auswahl gleich an 1. Stelle )

Marius Raabe

Dragon NaturallySpeaking 11.5 Legal
Windows 7 Prof. 64-Bit, Office 2010, Jarte Plus
Philips SpeechMike II Pro Plus, SpeechMike III, SpeechMike Air, PDCC 2.8
Intel Core2 Quad Q9550, 2,83 GHz, 2x6MB L-2, 8 GB RAM

Ähnliche Themen Antworten/Neu Letzter Beitrag⁄Zugriffe
Philips DPM 7000/7200 vs. 8000/8200...Was ist "besser" für Dragon?
Erstellt im Forum Geräte und Hardware von
7 02.05.2017 19:01
von Jedlova • Zugriffe: 127
DNS 12.5 Premium ist schleppend Langsam und unbenutzbar
Erstellt im Forum Fragen zur Anwendung von
5 05.05.2014 23:28
von R.Wilke • Zugriffe: 33
Dragon hängt - Häufige Fehlermeldung: RPC-Server ist nicht verfügbar
Erstellt im Forum Fehlermeldungen von
1 06.11.2012 08:12
von Lupus Beta • Zugriffe: 122
Erster 11.5-Ausstieg! Ist Philips schuld?
Erstellt im Forum Berichte und Tipps von
16 15.02.2012 10:07
von monkey8 • Zugriffe: 65
Welches E-Mail Programm benutzt ihr/ist am kompatibelsten mit DNS
Erstellt im Forum Fragen zur Anwendung von
10 26.07.2011 08:53
von winterstiefel • Zugriffe: 35
mein Dragon ist total kaputt:-(
Erstellt im Forum Fehlermeldungen von
4 10.06.2011 14:46
von Stecknadel • Zugriffe: 31
Was hiermit bewiesen wäre - Dragon 11 ist leistungsfähiger
Erstellt im Forum Fragen zur Anwendung von
14 22.10.2010 18:08
von R.Wilke • Zugriffe: 55
Was ist, wie funktioniert und wozu dient Spracherkennung?
Erstellt im Forum FAQ & Troubleshoot: von
0 17.02.2010 22:59
von R.Wilke • Zugriffe: 70
Was ist und wie funktioniert "Wörter exportieren/importieren"?
Erstellt im Forum FAQ & Troubleshoot: von
0 17.02.2010 22:52
von R.Wilke • Zugriffe: 65
 Sprung  
Xobor Ein Kostenloses Forum | Einfach ein Forum erstellen
Datenschutz