1

Thema: Voctool ./. "Worte aus Dokumenten dem Vokabular hinzufügen"

Der Drachen bietet beides an, aber genutzt habe ich die erste Möglichkeit noch nicht. Besteht ein Unterschied zur zweiten?

DNS 11 Prof - Win7/64 Ultim - Intel Xeon W3520/12 GB - SSD Intel 160 GB

2

Re: Voctool ./. "Worte aus Dokumenten dem Vokabular hinzufügen"

Außer dass bei Voctool eine Vielzahl von Optionen zur Verfügung stehen - z.B. der schon anderenorts erwähnte "Middle Slot" in der Pro-Version -, habe ich noch nie einen Unterschied bemerkt, was den Effekt betrifft. Vorschlag: Beides gegeneinander testen und vergleichen, geht ganz einfach; neues Profil ohne Training anlegen und sichern, Mustertexte einmal mit Voctool analysieren, Profil speichern; entweder neues Profil anlegen, oder das von vorhin wiederherstellen (das gesicherte backup vor Voctool), und dann die Mustertexte mittels "Erkennungscenter" analysieren, Profil speichern. Welches ist besser?

Grüße
Rüdiger Wilke

DPI 15.3 (15.30.000.006) auf Windows 8.1 (64-bit)
SpeechMike Premium (LFH3500) mit Philips Device Control Center (3.0)
Intel i7 2600 QuadCore - 3.4 GHz - 8 MB L3-Cache - 6 GB RAM

3

Re: Voctool ./. "Worte aus Dokumenten dem Vokabular hinzufügen"

Danke, aber wenn der oberste Guru sagt, das bringe nichts, spare ich mir gern einen eigenen Versuch.

DNS 11 Prof - Win7/64 Ultim - Intel Xeon W3520/12 GB - SSD Intel 160 GB

4

Re: Voctool ./. "Worte aus Dokumenten dem Vokabular hinzufügen"

oguh schrieb:

Danke, aber wenn der oberste Guru sagt, das bringe nichts, spare ich mir gern einen eigenen Versuch.

Hallo zusammen,

Das Werkzeug im Erkennungscenter macht eine inkrementelle Anpassung des Vokabulars, das Voctool  überschreibt das vorhandene Sprachmodell. Das hat seinen Sinn: das Erkennungscenter wird vom Benutzer eingesehen und verwendet, um von Zeit zu Zeit Dokumente hinzuzufügen. Würde es nicht inkrementell arbeiten, wäre das gesamte Vokabular dahin. Das Voctool wird i.d.R. von Händlern benutzt, die einmalig ein Vokabular als Dienstleistung erstellen und daher ein fertiges Produkt abliefern müssen. Dabei wird das Sprachmodell im Middle Slot gespeichert, wo es vor Zugriffen durch den Benutzer sicher sein sollte (bis dieser das VocTool entdeckt, aber das ist eine andere Geschichte).

Insofern wird der vorgeschlagene Test vermutlich identische Resultate zeigen - spannend wird es ab dem 2. Durchlauf. In der Praxis hat sich übrigens gezeigt, dass die Kombination das beste Ergebnis bringt - erst ein fachgerecht erstelltes Vokabular im VocTool mit vielen sorgfältig aufbereiteten Dokumenten, dann eine benutzerdefinierte Anpassung mit ein paar aktuellen Dokumenten im Erkennungscenter.

-dsk

5

Re: Voctool ./. "Worte aus Dokumenten dem Vokabular hinzufügen"

Hallo dsk,

dem will ich nicht widersprechen, aber hinzufügen, dass Voctool im Detail die Optionen bereit stellt, das Sprachmodell im User-Slot, wie über das Erkennungscenter, entweder zu erweitern, oder aber, im Unterschied dazu, komplett zu überschreiben. Beim Middle-Slot bestehen diese Unterschiede nicht, wie Du schon erklärt hast. Meine Tests habe ich sowohl im User-Slot als auch im Middle-Slot vorgenommen, und bin zum Ergebnis gekommen, dass es keinen Unterschied macht. Allerdings, in Prozentzahlen kann ich das nicht belegen, und Anspruch auf Allgemeingültigkeit erhebe ich auch nicht.

Ich frage mich allerdings noch, was ein "fachgerecht erstelltes Vokabular" von dem unterscheidet, was ich habe.

Grüße
Rüdiger Wilke

DPI 15.3 (15.30.000.006) auf Windows 8.1 (64-bit)
SpeechMike Premium (LFH3500) mit Philips Device Control Center (3.0)
Intel i7 2600 QuadCore - 3.4 GHz - 8 MB L3-Cache - 6 GB RAM

6

Re: Voctool ./. "Worte aus Dokumenten dem Vokabular hinzufügen"

Hallo Rüdiger,

R.Wilke schrieb:

Ich frage mich allerdings noch, was ein "fachgerecht erstelltes Vokabular" von dem unterscheidet, was ich habe.

in der Art und Weise der Erstellung vermutlich gar nichts außer der Menge an Dokumenten, die eingegangen ist - aber wer ist schon so ein Power User wie Du?

Um aber eine gewisse Perspektive auf professionelle Fachvokabulare zu werfen - hier reden wir von Wortlisten mit bis zu 50.000 Wörtern und Texten im Umfang von Dutzenden von Megabyte (plain text!), auf deren Grundlage das Vokabular erstellt wurde. Ein einzelner Anwender hat in der Regel wesentlich weniger Material zur Verfügung, muss damit aber natürlich auch nur seinen persönlichen Wortschatz abdecken, hätte also zum Beispiel nicht den Anspruch, allen Radiologen der Republik einen brauchbaren Wortschatz, der nur noch minimal ergänzt werden müsste, zu liefern.

-dsk

7

Re: Voctool ./. "Worte aus Dokumenten dem Vokabular hinzufügen"

dsk,

es liegt mir selbstverständlich fern, euch Händlern das lukrative Geschäft mit den Fachvokabularen kaputtzumachen, und wäre ich zum Beispiel Radiologe, müsste ich mich ernsthaft fragen, ob ich mir selbst die Mühe machen will, all die möglicherweise für mein Gebiet relevanten Fachbegriffe - wenn es denn vielleicht 50.000 sind - selbst zusammenzusuchen, oder aber circa 500 € zu investieren und dafür ein vorgefertigtes Vokabular mit entsprechenden im Sprachmodell hinterlegten Kontexten direkt einsetzen zu können.

Für mein spezielles Gebiet gibt es anscheinend aber kein geeignetes vorgefertigtes Fachvokabular, am nächsten käme dem das "Architektur/Bau", das habe ich einmal getestet und nach circa 5 min für ungeeignet befunden. Mit meinem selbst zusammengetragenen Wortschatz von etwa 8000 Einträgen und etwa 500 dicht bedruckten Seiten Text für die Dokumentanalyse komme ich aber bestens zurecht. Allerdings war es schon ein Stück Arbeit, das erst einmal alles zu sammeln und in geeigneter Weise aufzubereiten.

Die Ausgangsfrage war aber, wenn ich mich recht erinnere, ob es für den Anwender einen Unterschied macht, ob er die Dokumentanalyse im Erkennungscenter oder aber das so genannte und etwas versteckte "VocTool" einsetzt, und da bin ich ganz klar der Meinung, es macht keinen Unterschied.

Eine letzte Bemerkung noch zu den Fachvokabularen: auch die Händler haben keine anderen Geheimwaffen zur Verfügung als die eben genannten.

Grüße
Rüdiger Wilke

DPI 15.3 (15.30.000.006) auf Windows 8.1 (64-bit)
SpeechMike Premium (LFH3500) mit Philips Device Control Center (3.0)
Intel i7 2600 QuadCore - 3.4 GHz - 8 MB L3-Cache - 6 GB RAM

8

Re: Voctool ./. "Worte aus Dokumenten dem Vokabular hinzufügen"

R.Wilke schrieb:

Für mein spezielles Gebiet gibt es anscheinend aber kein geeignetes vorgefertigtes Fachvokabular, am nächsten käme dem das "Architektur/Bau", das habe ich einmal getestet und nach circa 5 min für ungeeignet befunden. Mit meinem selbst zusammengetragenen Wortschatz von etwa 8000 Einträgen und etwa 500 dicht bedruckten Seiten Text für die Dokumentanalyse komme ich aber bestens zurecht. Allerdings war es schon ein Stück Arbeit, das erst einmal alles zu sammeln und in geeigneter Weise aufzubereiten.

Die Ausgangsfrage war aber, wenn ich mich recht erinnere, ob es für den Anwender einen Unterschied macht, ob er die Dokumentanalyse im Erkennungscenter oder aber das so genannte und etwas versteckte "VocTool" einsetzt, und da bin ich ganz klar der Meinung, es macht keinen Unterschied.

Eine letzte Bemerkung noch zu den Fachvokabularen: auch die Händler haben keine anderen Geheimwaffen zur Verfügung als die eben genannten.

Grüße
Rüdiger Wilke

Hallo Rüdiger,

Sehe ich anders, eben deswegen, weil das VocTool das Sprachmodell überschreibt, das Erkennungscenter das Sprachmodell ergänzt. Bevor der Anwender sich was kaputt macht, sollte er lieber das Erkennungscenter benutzen, das außerdem für ihn viel leichter zugänglich ist.

8000 Wörter und 500 Seiten Text sind für einen einzelnen Anwender schon eine Masse - damit bekommt man schon ein sehr gutes Vokabular hin.

Jetzt noch zu dem, was die Händler tun: Sie haben vielleicht keine anderen Waffen, wissen die aber besser einzusetzen :-) und haben vor allen Dingen nicht nur 500 Seiten Text von einem einzigen Anwender zur Verfügung (no offence meant, aber für eine ganze Berufsgruppe ist das nicht repräsentativ).

-dsk