Utilisation des diagnostics vocaux

Utilisez l'outil Diagnostics vocaux pour déterminer les éléments que le moteur Speakeasy reconnaît avec succès, et pour ajuster manuellement le seuil de détection et le niveau de confiance afin d'améliorer la reconnaissance.

Avant de commencer à utiliser les diagnostics vocaux, vérifiez que le casque est branché et fonctionne correctement.

Les diagnostics vocaux sont conçus pour modifier manuellement des paramètres ou pour diagnostiquer les problèmes.

Voir une vidéo (4:20)

Seuil absolu

Le seuil absolu correspond à la quantité d'énergie nécessaire pour que Speakeasy reconnaisse le son comme étant un discours. Si le moteur Speakeasy ne renvoie pas de résultat, l'entrée micro n'est peut-être pas assez sonore pour que le moteur reconnaisse un discours. Réduisez le seuil absolu pour détecter davantage de sons comme étant des paroles. Si le moteur Speakeasy renvoie des résultats vocaux en présence de bruits de fond, augmenter le seuil pour que moins de sons soient identifiés comme des paroles.

Valeurs de confiance

Lorsque le moteur Speech-to-Text détecte des paroles, il tente de les mettre en correspondance avec les expressions attendues dans les fichiers de grammaire disponibles. Le degré de correspondance entre les mots prononcés et la correspondance attendue s'appelle valeur de confiance. Plus la valeur de confiance est élevée, plus la correspondance est exacte. Si la valeur de confiance est trop faible, l'entrée est rejetée et Speakeasy ne renvoie aucun résultat.

Dans l'outil de diagnostics vocaux, lorsque la valeur de confiance des paroles détectées est au-dessus du seuil, le terme s'affiche en vert au bas de l'écran. Lorsque la valeur de confiance d'un terme est sous le seuil de confiance, Speakeasy affiche la meilleure correspondance en rouge au bas de l'écran. Pour afficher les autres termes du fichier de grammaire susceptibles de correspondre aux paroles détectées, cliquez sur le terme pour afficher les autres expressions que Speakeasy a tenté de mettre en correspondance, ainsi que les valeurs de confiance associées.

L'outil de diagnostics vocaux affiche la valeur de confiance de chaque expression détectée par Speakeasy, et vous permet de configurer le seuil ou la valeur de confiance. Si le seuil est trop faible, Speakeasy peut renvoyer trop de faux positifs. Cependant, si le seuil est trop élevé, Speakeasy risque de ne pas reconnaître les expressions exactes.

Dépannage vocal

Pour utiliser les diagnostics vocaux afin de dépanner une mauvaise reconnaissance vocale, vous devez être capable de reproduire les paroles, ainsi que les bruits de fond, s'ils ont un impact. Vous pouvez être amené à créer un enregistrement où l'utilisateur prononce plusieurs fois l'expression voulue, puis à lire cet enregistrement lorsque les diagnostics vocaux sont en cours.

Commencez par ajuster le seuil absolu ou le niveau de confiance pour voir si vous obtenez de meilleurs résultats. Si la modification de ces paramètres améliore les résultats, vous pouvez utiliser un script pour les définir automatiquement. Pour en savoir plus sur l'utilisation de scripts pour changer les paramètres de Speakeasy, consultez la section API vocales dans le Guide des scripts Velocity.

S'il existe un terme que Speakeasy ne reconnaît jamais ou qu'il confond avec un autre, essayez de changer ce terme dans le fichier de grammaire pour le rendre plus distinct. Pour rendre des termes plus distincts, vous pouvez :

Utiliser une autre expression. Par exemple, au lieu de « accélérer », utilisez « augmenter la vitesse ». 

Ajouter un autre mot au terme concerné. Par exemple, au lieu de « accélérer », utilisez « faire plus vite ». Ou, au lieu de « deux », utilisez « l'un et l'autre ».

Épelez le mot de façon plus phonétique dans le fichier de grammaire. Par exemple, remplacez « v'nir » par « venir ».

Pour en savoir plus sur la définition de termes dans le fichier de grammaire, consultez le Guide de référence Speakeasy.

Pour utiliser les diagnostics vocaux :

Pour ouvrir l'outil Diagnostics vocaux dans le client Velocity, accédez à Menu > Diagnostics vocaux.

Pour tester l'outil sur un jeu d'expressions spécifique, utilisez le menu déroulant Grammaire pour sélectionner le fichier de grammaire.

Pour suspendre la reconnaissance vocale, définissez l'option Détection vocale, en haut de la page, sur Désactivé.

Pour ajuster la détection afin que Speakeasy détecte les paroles avec un niveau d'énergie moins élevé, utilisez le curseur Seuil absolu. Les barres vertes en haut de la page montrent le niveau d'énergie actuellement détecté et le niveau d'énergie moyen des 5 dernières secondes. Essayez de définir le seuil absolu sur le seuil le plus élevé auquel vous obtenez des résultats corrects. Si le seuil d'énergie défini est trop faible, Speakeasy détecte davantage de bruits de fond et peut renvoyer plus de faux positifs.

Pour ajuster le niveau de confiance, utilisez le curseur Niveau de confiance. Essayez de définir le niveau de confiance sur le seuil le plus élevé auquel vous obtenez des résultats corrects.