使用語音診斷

使用語音診斷工具來判斷哪一個 Speakeasy 引擎辨識成功,並手動調整偵測閾值和信賴等級以改善辨識。

使用語音診斷之前,務必確認耳機已連接且運作正常。

語音診斷是針對手動變更設定或診斷問題而設計的。

觀看視訊 (4:20)

絕對閾值

絕對閾值是指在 Speakeasy 將輸入辨識為語音之前需要多少能源。 如果 Speakeasy 引擎未傳回結果,那表示麥克風輸入可能不夠大聲,使引擎無法辨識語音。 降低絕對閾值,以便將較多噪音偵測為語音。 如果在有背景噪音時,Speakeasy 引擎傳回語音結果,請提高閾值以便將較少噪音偵測為語音。

信賴等級值

當語音轉文字引擎偵測到語音時,會試著將它與可用語法檔案內的預期字詞比對。 口語字詞與預期字詞的相符程度稱為信賴等級值。 信賴等級值越高表示相符程度越好。 如果信賴等級值太低,則會拒絕輸入且 Speakeasy 不會傳回結果。

在語音診斷工具中,若偵測語音的信賴等級值高於閾值,字詞會在畫面底部顯示為綠色。 若字詞的信賴等級值低於信賴等級閾值,Speakeasy 會在畫面底部將最佳比對結果顯示為紅色。 若要檢視語法檔案中可能符合偵測語音的其他字詞,請按一下該字詞,即可查看 Speakeasy 試著比對的其他字詞,以及與那些字詞相關聯的信賴等級值。

語音診斷工具會顯示 Speakeasy 偵測的每一個字詞的信賴等級值,並讓您設定信賴等級閾值或信賴等級值。 如果閾值太低,Speakeasy 可能會辨識到太多誤判。 不過,如果閾值太高,Speakeasy 又可能無法辨識正確的字詞。

疑難排解語音

若要使用語音診斷來疑難排解不理想的辨識,您必須能夠重現語音,而且如果背景噪音是因素,則也要能重現背景噪音。 您可能需要建立使用者說出字詞數次的錄音,然後在語音診斷開啟的情況下播放錄音。

首先調整絕對閾值或置信度,看看是否能獲得更好的結果。 如果變更這些設定可改善結果,您可以使用指令碼來自動設定它們。 如需使用指令碼變更 Speakeasy 設定的詳細資訊,請參閱 Velocity 指令碼指南中的語音 API

如果 Speakeasy 持續無法辨識某個字詞,或者持續傳回錯誤結果,可考慮在語法檔案中變更該字詞,使其更為明確。 若要使字詞更加明確,您可以:

使用不同的字詞。 例如,不使用「更快」,改用「飛行速度」。 

新增另一個字至字詞中。 例如,不使用「更快」,改用「語速更快」。或者不使用「二者」,改用「二者就緒」。

在語法檔案中,以更符合發音的方式拼字。 例如,不使用 'picking',改用 'peeking'。

如需在語法檔案中指定字詞的資訊,請參閱 Speakeasy 參考指南

若要使用語音診斷:

在 Velocity 用戶端中開啟語音診斷,瀏覽到功能表 > 語音診斷

若要測試一組特定字詞,請使用語法下拉式功能表來選取語法檔案。

若要暫停語音辨識,請將頁面頂端的語音偵測選項設定為

若要調整偵測,讓 Speakeasy 以較低的能源等級偵測語音,請使用絕對閾值滑桿。 頁面頂端的綠色列顯示目前偵測的能源等級和過去 5 秒的平均能源等級。 試著將絕對閾值設定為您會持續獲得正確結果的最高閾值。 能源閾值設得太低,表示 Speakeasy 會偵測較多背景噪音,並可能傳回較多誤判。

若要調整信賴等級閾值,請使用信賴等級滑桿。 試著將信賴等級設定為您會持續獲得正確結果的最高閾值。