音声診断の使用
音声診断ツールを使用して、 Speakeasy エンジンが何を正常に認識しているかを特定し、検出のしきい値と信頼レベルを手動で調整して、認識を改善します。
音声診断を使い始める前に、ヘッドセットが接続され、正しく機能していることを確認してください。
音声診断は、設定の手動変更あるいは問題の診断用として設計されています。
絶対しきい値
絶対しきい値は、Speakeasy が音声を入力として認識するのに必要なエネルギー量です。 Speakeasy エンジンが結果を返していない場合、 マイク入力が、エンジンが音声を認識するに十分な音量ではない可能性があります。 しきい値を下げると、より多くのノイズが音声として検出されます。 周囲にノイズがある環境で Speakeasy エンジンが音声結果を返している場合は、しきい値を上げて、音声として検出されるノイズの量を減らします。
信頼値
音声テキスト交換エンジンは、音声を検出すると、使用可能な文法ファイル内にある予期される語句との突き合わせを試行します。 発話された語句と予期される応答の一致の度合いを、信頼値と呼びます。 信頼度が高いほど、一致度が高いことを示します。 信頼値が低すぎると、入力が拒否され、Speakeasy は結果を返しません。
音声診断ツールでは、検出された音声に対する信頼値がしきい値よりも高い場合に、その用語が画面の下部に緑色で表示されます。 用語の信頼値が信頼しきい値を下回っている場合、Speakeasy は最適な一致を画面の下部に赤色で表示します。 文法ファイル内の、検出された音声と一致していた可能性のある他の用語を表示するには、用語をクリックして、Speakeasy が突き合わせを試行していた他の語句と、それらの語句に関連付けられていた信頼値を確認します。
音声診断ツールでは、Speakeasy が検出した語句ごとに信頼値が表示され、信頼のしきい値や値を構成できます。 しきい値が低すぎると、Speakeasy の誤検出の数が多くなりすぎる可能性があります。 ただし、しきい値が高すぎると、Speakeasy が正確な語句を認識しない可能性があります。
音声のトラブルシューティング
認識不良のトラブルシューティングのために音声診断を使用する場合は、音声、ならびに周囲のノイズも要因であるなら周囲のノイズも再生できることが必要になります。 ユーザが語句を複数回発話したものを録音し、音声診断が開かれている間、その録音を再生することをお勧めします。
絶対しきい値または信頼レベルを調整して、より良い結果が得られるかどうかを確認することから始めます。 これらの設定を変更して結果が改善するなら、自動設定のためのスクリプトを使用できます。 スクリプトを使用した Speakeasy 設定の変更の詳細については、『Velocity スクリプト ガイドの音声 API』をご参照ください。
Speakeasy が常に認識に失敗する用語、あるいは常に間違った結果を返す用語がある場合は、文法ファイル内のその用語を、より明確なものとなるように変更することを検討してください。 用語をより明確なものとなるようにするには、次のことを行えます。
•別の用語を使用する。 たとえば、「faster」ではなく「warp speed」を使用します。
•その用語に別の語を追加する。 たとえば、「faster」ではなく「speak faster」を使用します。または、「two」ではなく「two ready」を使用します。
•文法ファイル内のその語のスペルを、より音声学的なものにする たとえば、「picking」ではなく「peeking」を使用します。
文法ファイルでの用語の指定については、 『Speakeasy リファレンス ガイド』をご参照ください。
音声診断を使用するには:
•Velocity クライアントで音声診断を開くには、 [メニュー] > [音声診断] に移動します。
•特定の語句のセットに照らしてテストするには、[文法] ドロップダウン メニューを使用して文法ファイルを選択します。
•音声認識を一時停止するには、ページ上部にある [音声検出] オプションを [オフ] に設定します。
•エネルギー レベルがより低い音声を Speakeasy が検出するように検出を調整するには、[絶対しきい値] スライダを使用します。 ページ上部の緑色のバーに、現在検出されているエネルギー レベルと、過去5秒間の平均エネルギー レベルが表示されます。 絶対しきい値を、安定して正しい結果が得られる最も高いしきい値に設定してみます。 エネルギーしきい値を低く設定しすぎると、Speakeasy が周囲のノイズを多く検出するようになり、より多くの誤検出が返されるようになる可能性があります。
•信頼しきい値を調整するには、[信頼レベル] スライダを使用します。 信頼レベルを、安定して正しい結果が得られる最も高いしきい値に設定してみます。