使用语音诊断

使用语音诊断工具以确定 Speakeasy 引擎成功识别的内容,然后手动调整检测阈值和可信度以提高识别能力。

在开始使用语音诊断之前,请确保耳机已连接并能正常工作。

语音诊断用于手动更改设置或处理诊断问题。

观看视频 (4:20)

绝对阈值

绝对阈值是指 Speakeasy 将输入作为语音进行识别前所需要的能量。 如果 Speakeasy 引擎未返回结果,则麦克风输入的音量可能不足以使引擎识别语音。 降低绝对阈值以将更多噪声检测为语音。 在存在背景噪声的情况下,如果 Speakeasy 引擎正在返回语音结果,提高阈值可将更少的噪声检测为语音。

可信度值

若语音转文本引擎检测到语音,则将尝试与可用语法文件中的预期字词进行匹配。 语音字词和预期响应的匹配程度称为可信度值。 可信度值越高表示匹配越好。 如果可信度值过低,则输入将遭到拒绝,Speakeasy 将不会返回结果。

在语音诊断工具中,若检测到的语音可信度值高于阈值,相关字词将在屏幕底部以绿色显示。 若字词可信度值低于可信度阈值,Speakeasy 将在屏幕底部以红色显示最佳匹配项。 若要查看语法文件中可能与检测语音相匹配的其他字词,应单击该字词以查看 Speakeasy 尝试匹配的其他字词以及与之相关的可信度值。

语音诊断工具将显示 Speakeasy 检测到的每个字词的可信度值,并允许您对可信度阈值或数值进行配置。 如果阈值过低,Speakeasy 可能会识别出过多误报。 然而,如果阈值过高,Speakeasy 则可能无法识别准确的字词。

语音故障排除

若要使用语音诊断程序来解决识别能力不佳的问题,您将需要能够重新生成语音和背景噪声(如果其是一个因素)。 您可能要创建用户多次说出相关字词的录音,然后在打开语音诊断工具时播放该录音。

首先调整绝对阈值或置信度,看看是否能获得更好的结果。 如果更改这些设置可改善结果,则可以使用脚本对其进行自动设置。 有关使用脚本更改 Speakeasy 设置的详细信息,请参阅 Velocity 脚本指南中的语音 API

如果有 Speakeasy 始终无法识别的字词,或者其始终返回错误的结果,则应考虑更改语法文件中的字词以使其变得更加清楚。 为了使字词更加清楚,您可以:

使用不同的字词。 例如,使用“飞行速度”来代替“更快”。 

在字词中添加其他单词。 例如,使用“语速更快”来代替“更快”,或使用“两个就绪”来代替“两个”。

在语法文件中根据发音拼写单词。 例如,使用 'peeking' 来代替 'picking'。

有关在语法文件中指定字词的信息,请参阅 Speakeasy 参考指南

使用语音诊断:

若要在 Velocity 客户端中打开语音诊断,应导航至菜单 > 语音诊断

若要针对一组特定的短语进行测试,应使用语法下拉菜单来选择语法文件。

若要暂停语音识别,应将页面顶部的语音检测选项设为

若要调整检测以使 Speakeasy 以较低的能量级别检测语音,应使用绝对阈值滑块。 页面顶部的绿条显示了当前检测到的能量级别,以及前 5 秒钟的平均能量级别。 设法将绝对阈值设为最高阈值,以便持续获取正确结果。 将能量阈值设得过低意味着 Speakeasy 将检测到更多的背景噪声,并可能返回更多的误报。

要调整可信度阈值,应使用可信度滑块。 尝试将可信度设置为最高阈值,以便持续获取正确结果。