Verwenden der Sprachdiagnose

Bestimmen Sie anhand des Spracherkennungstools, was vom Speakeasy-Modul richtig erkannt wird. Passen Sie den Erkennungsschwellenwert und das Konfidenzniveau manuell an, um die Erkennung zu optimieren.

Stellen Sie vor dem Verwenden der Sprachdiagnose sicher, dass Ihr Headset angeschlossen ist und ordnungsgemäß funktioniert.

Die Sprachdiagnose wurde entwickelt, um manuelle Änderungen an Einstellungen und das Diagnostizieren von Problemen zu ermöglichen.

Video zu diesem Thema ansehen (4:20)

Absoluter Schwellenwert

Der absolute Schwellenwert gibt an, wie viel Energie erforderlich ist, damit Speakeasy die Eingabe als Sprache erkennt. Sollte das Speakeasy-Modul keine Ergebnisse ausgeben, ist das Mikrofon möglicherweise zu leise eingestellt, sodass das Modul keine Sprache erkennen kann. Legen Sie einen niedrigeren absoluten Schwellenwert fest, damit mehr Geräusche als Sprache erkannt werden. Wenn das Speakeasy-Modul bei vorhandenen Hintergrundgeräuschen Sprachergebnisse ausgibt, passen Sie den Schwellenwert nach oben an, damit weniger Geräusche als Sprache erkannt werden.

Konfidenzwerte

Erkennt das Sprache-in-Text-Modul Sprache, versucht es, in den verfügbaren Grammatikdateien die Sprache mit den erwarteten Phrasen abzugleichen. Das Ausmaß, in dem die gesprochene Phrase und die erwartete Antwort übereinstimmen, wird als Konfidenzniveau bezeichnet. Ein höherer Konfidenzwert weist auf eine höhere Übereinstimmung hin. Ist der Konfidenzwert zu niedrig, wird die Eingabe abgelehnt und Speakeasy zeigt kein Ergebnis an.

Liegt der Konfidenzwert der erkannten Sprache im Sprachdiagnosetool über dem Schwellenwert, wird der Begriff grün im unteren Bildschirmbereich angezeigt. Liegt der Konfidenzwert für einen Begriff unter dem Konfidenzschwellenwert, zeigt Speakeasy den besten Treffer rot im unteren Bereich des Bildschirms an. Um andere Begriffe der Grammatikdatei anzuzeigen, die möglicherweise mit der erkannten Sprache hätten übereinstimmen können, klicken Sie auf den Begriff. Daraufhin wird angezeigt, welche anderen Phrasen Speakeasy abzugleichen versucht hat. Die damit verbundenen Konfidenzwerte werden ebenfalls angezeigt.

Das Sprachdiagnosetool zeigt den Konfidenzwert für jede von Speakeasy erkannte Phrase. Es ermöglicht Ihnen das Konfigurieren eines Schwellenwerts oder Werts für die Konfidenz. Ist der Schwellenwert zu niedrig, erkennt Speakeasy eventuell zu viele falsche Positivergebnisse. Ist der Schwellenwert jedoch zu hoch, erkennt Speakeasy die Phrasen möglicherweise nicht genau.

Fehlerbehebung bei der Sprache

Wenn Sie die Sprachdiagnose zur Behebung einer schlechten Erkennungsgüte einsetzen möchten, müssen Sie die Sprache und das Hintergrundgeräusch reproduzieren können, falls dies die Ursache für die schlechte Qualität ist. Sie können dazu eine Aufnahme des Benutzers erstellen, während er die Phrase mehrfach ausspricht, und anschließend die Aufnahme bei geöffneter Sprachdiagnose wiedergeben.

Passen Sie zunächst den absoluten Schwellenwert oder das Konfidenzniveau an und prüfen Sie, ob Sie bessere Ergebnisse erzielen. Falls die Ergebnisse durch das Ändern der Einstellungen besser werden, können Sie ein Skript einsetzen, um sie automatisch einzustellen. Weitere Informationen zum Verwenden von Skripten, um die Einstellungen von Speakeasy zu ändern, finden Sie im Abschnitt über Sprach-APIs in der Anleitung für Velocity-Skripte.

Wenn es einen Begriff gibt, den Speakeasy immer wieder entweder gar nicht oder falsch erkennt, können Sie den Begriff in der Grammatikdatei ändern, damit er eindeutiger ist. Sie haben folgende Möglichkeiten, um Begriffe eindeutiger abzugrenzen:

Verwenden Sie eine andere Phrase. Beispiel: Verwenden Sie statt "schneller" das Wort "Verzerrungsgeschwindigkeit".

Fügen Sie einen weiteren Begriff hinzu. Beispiel: Verwenden Sie statt "schneller" die Phrase "schneller sprechen" oder statt "zwei" verwenden Sie "zwei bereit".

Sprechen Sie das Wort in der Grammatikdatei phonetischer aus. Verwenden Sie beispielsweise "Mais" anstelle von "Eis".

Informationen zum Angeben von Begriffen in Grammatikdateien finden Sie im Referenzhandbuch für Speakeasy.

So verwenden Sie die Sprachdiagnose:

Öffnen Sie die Sprachdiagnose im Velocity Client, indem Sie zu Menü > Sprachdiagnose wechseln.

Verwenden Sie zum Testen einer bestimmten Phrasengruppe das Dropdownmenü Grammatik und wählen Sie die Grammatikdatei aus.

Setzen Sie zum Anhalten der Spracherkennung die Option Spracherkennung oben auf der Seite auf Aus.

Passen Sie die Erkennung so an, dass Speakeasy Sprache mit einer geringeren Energiestufe erkennt. Verwenden Sie dazu den Schieberegler Absoluter Schwellenwert. Die grünen Balken oben auf der Seite zeigen die aktuell erkannte Energiestufe und die durchschnittliche Energiestufe der letzten 5 Sekunden an. Setzen Sie den absoluten Wert auf den höchsten Schwellenwert, bei dem Sie konsequent korrekte Ergebnisse erhalten. Wenn Sie den Energieschwellenwert zu niedrig einstellen, erkennt Speakeasy mehr Hintergrundgeräusche und gibt möglicherweise mehr falsche Positivergebnisse aus.

Passen Sie den Konfidenzschwellenwert mit dem Schieberegler Konfidenzniveau an. Legen Sie die Zuverlässigkeitsstufe auf den höchsten Schwellenwert, bei dem Sie konsequent korrekte Ergebnisse erhalten.