Uso del diagnóstico de voz

Utilice la herramienta de diagnóstico de voz para determinar lo que el motor de Speakeasy reconoce correctamente y ajuste manualmente el umbral de detección y el nivel de confianza para mejorar el reconocimiento.

Antes de empezar a usar el diagnóstico de voz, asegúrese de que los auriculares están conectados y que funcionan correctamente.

El diagnóstico de voz está diseñado para cambiar manualmente los ajustes o para el diagnóstico de problemas.

Vea un vídeo (4:20)

Umbral absoluto

El umbral absoluto es la cantidad de energía necesaria para que Speakeasy reconozca la entrada como voz. Si el motor de Speakeasy no devuelve resultados, es posible que la entrada del micrófono no sea suficientemente alta para que el motor reconozca la voz. Reduzca el umbral absoluto para detectar más ruidos como voz. Si el motor de Speakeasy devuelve resultados de voz cuando hay ruido de fondo, eleve el umbral para detectar menos ruido como voz.

Valores de confianza

Cuando el moto de voz a texto detecta voz, intenta emparejarla con las frases esperadas de los archivos de gramática disponibles. El grado de coincidencia de la frase emitida y la respuesta esperada se llama valor de confianza. Un valor de confianza más alto indica una coincidencia mejor. Si el valor de confianza es demasiado bajo, las entradas se rechazan y Speakeasy no devuelve ningún resultado.

En la herramienta de diagnóstico de voz, cuando el valor de confianza de la voz detectada supera el umbral, el término se muestra en verde en la parte inferior de la pantalla. Cuando el valor de confianza de un término se encuentre por debajo del umbral de confianza, Speakeasy mostrará la mejor coincidencia en rojo, en la parte inferior de la pantalla. Para ver otros términos del archivo de gramática que puedan tener equivalencias en la voz detectada, haga clic en el término para ver otras frases que Speakeasy haya intentado emparejar y los valores de confianza asociados.

La herramienta de diagnóstico de voz muestra el valor de confianza de cada frase que detecta Speakeasy y le permite configurar el umbral o el valor de confianza. Si el umbral es muy bajo, Speakeasy podría reconocer demasiados falsos positivos. No obstante, si el umbral es demasiado alto, Speakeasy podría no reconocer las frases correctas.

Solución de problemas de voz

Para usar el diagnóstico de voz para solucionar problemas de reconocimiento pobre, debe poder reproducir la voz, así como el ruido de fondo, si es un factor. Es posible que quiera crear una grabación de un usuario diciendo la frase varias veces y luego reproducir la grabación mientras está abierto el diagnóstico de voz.

Empiece por ajustar el umbral absoluto o el nivel de confianza para ver si obtiene mejores resultados. Si los resultados mejoran al cambiar estos ajustes, puede usar una secuencia de comandos para ajustarlos automáticamente. Para obtener más información sobre el uso de secuencias de comandos para cambiar los ajustes de Speakeasy, consulte la API de voz en la Guía de secuencias de comandos de Velocity.

Si hay un término que Speakeasy no consigue reconocer varias veces, o si devuelve el resultado incorrecto muchas veces, platéese cambiar el término en el archivo de gramática para hacerlo más reconocible. Para que los términos sean más claros, puede:

Utilizar una frase distinta. Por ejemplo, en lugar de "Más rápido", utilice "velocidad rápida". 

Agregar otra palabra al término. Por ejemplo, en lugar de "más rápido", utilice "hablar más rápido". O, en lugar de "dos", utilice "dos listo".

Deletree la palabra de manera más fonética en el archivo de gramática. Por ejemplo, en lugar de "ojear", utilice "mirar rápidamente".

Para obtener información sobre cómo especificar términos en archivos de gramática, consulte la Guía de referencia de Speakeasy.

Para usar el diagnóstico de voz:

Para abrir los diagnósticos de voz en el cliente de Velocity, acceda a Menú > Diagnóstico de voz.

Para probar un conjunto específico de frases, utilice el menú desplegable Gramática para seleccionar el archivo de gramática.

Para pausar el reconocimiento de voz, ajuste la opción Detección de voz en la parte superior de la página como Desactivado.

Para ajustar la detección para que Speakeasy detecte la voz con un nivel de energía inferior, utilice el control deslizante Umbral absoluto. Las barras verdes de la parte superior de la página muestran el nivel de energía detectado actualmente y el nivel de energía medio de los últimos 5 segundos. Intente ajustar el umbral absoluto en el nivel más alto en el que obtenga resultados correctos con regularidad. Ajustar el umbral de energía demasiado bajo significa que Speakeasy detecta más ruido de fondo y podría devolver más falsos positivos.

Para ajustar el umbral de confianza, utilice el control deslizante Nivel de confianza. Intente ajustar el nivel de confianza en el nivel más alto del umbral en el que obtenga resultados correctos con regularidad.