การใช้งานการวินิจฉัยเสียงพูด

ใช้เครื่องมือการวินิจฉัยเสียงพูด เพื่อตรวจสอบว่าเอนจินของ Speakeasy สามารถจำแนกได้สำเร็จหรือไม่ และปรับแต่งขีดจำกัดการตรวจจับและระดับความเชื่อมั่นด้วยตัวเอง เพื่อปรับปรุงการจำแนกให้ดียิ่งขึ้น

ก่อนที่คุณจะเริ่มใช้งานการวินิจฉัยเสียงพูด ตรวจสอบให้แน่ใจว่าได้เชื่อมต่อหูฟังไว้ และหูฟังทำงานได้ตามปกติ

การวินิจฉัยเสียงพูด ถูกออกแบบมาเพื่อให้สามารถเปลี่ยนแปลงการตั้งค่าด้วยตัวเอง หรือวินิจฉัยปัญหาได้

ชมวิดีโอ (4:20)

ขีดจำกัดสัมบูรณ์

ขีดจำกัดสัมบูรณ์คือพลังงานที่ต้องใช้ ก่อนที่จะ Speakeasy จะจำแนกอินพุตว่าเป็นเสียงพูด หากเอนจิน Speakeasy ไม่ส่งคืนผลลัพธ์ อินพุตไมโครโฟนอาจดังไม่พอที่เอนจินจะจำแนกเสียงพูดได้ การลดขีดจำกัดสัมบูรณ์จะส่งผลให้ระบบตรวจจับเสียงรบกวนเป็นเสียงพูดเพิ่มเติม หากเอนจิน Speakeasy ส่งคืนผลลัพธ์เสียงพูดในขณะที่มีเสียงรบกวนพื้นหลัง ให้เพิ่มขีดจำกัด เพื่อให้ระบบตรวจจับเสียงรบกวนเป็นเสียงพูดลดลง

ค่าความเชื่อมั่น

เมื่อเอนจินเสียงพูดเป็นข้อความตรวจจับเสียงพูด เอนจินจะพยายามจับคู่เสียงกับวลีที่คาดไว้ในไฟล์ไวยากรณ์ที่มีอยู่ ระดับความใกล้เคียงของวลีที่พูดกับคำตอบที่คาดคิดจับคู่กัน จะเรียกว่าค่าความเชื่อมั่น ค่าความเชื่อมั่นที่สูงขึ้น จะส่งผลให้การจับคู่ดีขึ้น หากค่าความเชื่อมั่นต่ำเกินไป อินพุตจะถูกปฏิเสธ และ Speakeasy จะไม่ส่งคืนผลลัพธ์

ในเครื่องมือการวินิจฉัยเสียงพูด เมื่อค่าความเชื่อมั่นของเสียงพูดที่ตรวจพบอยู่สูงกว่าขีดจำกัด คำศัพท์จะถูกแสดงเป็นสีเขียวที่ด้านล่างของหน้าจอ เมื่อค่าความเชื่อมั่นของคำศัพท์อยู่ต่ำกว่าขีดจำกัดความเชื่อมั่น Speakeasy จะแสดงผลการจับคู่ที่ดีที่สุดเป็นสีแดงที่ด้านล่างของหน้าจอ หากต้องการดูศัพท์อื่น ๆ จากไฟล์ไวยากรณ์ที่อาจจับคู่กับเสียงพูดที่ตรวจพบได้ ให้คลิกที่คำศัพท์เพื่อดูวลีอื่น ๆ ที่ Speakeasy พยายามจับคู่ด้วย และค่าความเชื่อมั่นของการจับคู่เหล่านั้น

เครื่องมือการวินิจฉัยเสียงพูด จะแสดงค่าความเชื่อมั่นของแต่ละวลีซึ่ง Speakeasy ตรวจพบ และจะช่วยให้คุณสามารถกำหนดค่าขีดจำกัดหรือค่าความเชื่อมั่นได้ หากขีดจำกัดต่ำเกินไป Speakeasy อาจจำแนกผลลัพธ์ที่เป็นเท็จได้เป็นจำนวนมากเกินไป อย่างไรก็ตาม หากขีดจำกัดสูงเกินไป Speakeasy ก็อาจไม่สามารถจำแนกวลีที่ถูกต้องได้

การแก้ไขปัญหาเสียงพูด

หากต้องการใช้งานการวินิจฉัยเสียงพูด เพื่อแก้ไขปัญหาการจำแนกที่ไม่มีประสิทธิภาพ คุณจะต้องสามารถเล่นซ้ำเสียงพูดได้ รวมถึงสัญญาณรบกวนพื้นหลังด้วย หากมี คุณอาจต้องการสร้างไฟล์บันทึกเสียงพูดวลีดังกล่าวของผู้ใช้หลาย ๆ ครั้ง แล้วเล่นไฟล์ดังกล่าวในระหว่างที่เปิดการวินิจฉัยเสียงพูด

เริ่มต้นด้วยการปรับระดับเกณฑ์สัมบูรณ์หรือระดับความเชื่อมั่นเพื่อดูว่าคุณจะได้ผลลัพธ์ที่ดีขึ้นหรือไม่ หากการเปลี่ยนแปลงการตั้งค่าเหล่านี้ช่วยให้ผลลัพธ์ดีขึ้น คุณจะสามารถใช้สคริปต์เพื่อตั้งค่าโดยอัตโนมัติได้ หากต้องการข้อมูลเพิ่มเติมเกี่ยวกับการใช้สคริปต์เพื่อเปลี่ยนแปลงการตั้งค่าของ Speakeasy ให้ดูที่ Voice API ในคู่มือการเขียนสคริปต์ Velocity

หากมีคำศัพท์ที่ Speakeasy ไม่สามารถจำแนกได้บ่อย ๆ หรือส่งคืนผลลัพธ์ที่ไม่ถูกต้องบ่อย ๆ ให้พิจารณาเปลี่ยนแปลงศัพท์ดังกล่าวในไฟล์ไวยากรณ์ เพื่อให้มีความชัดเจนยิ่งขึ้น เพื่อให้คำศัพท์มีความชัดเจนยิ่งขึ้น คุณสามารถ:

•ใช้วลีอื่น เช่น แทนการใช้คำว่า 'faster' ให้ใช้คำว่า 'warp speed'

•เพิ่มอีกหนึ่งคำลงในคำศัพท์ เช่น แทนคำว่า 'faster' ให้ใช้ 'speak faster' หรือแทนคำว่า 'two' ให้ใช้ 'two ready'

•สะกดคำในไฟล์ไวยากรณ์ให้ถูกต้องตามหลักการออกเสียงมากยิ่งขึ้น ตัวอย่างเช่น แทนคำว่า 'picking' ให้ใช้ 'peeking'

สำหรับข้อมูลเกี่ยวกับการระบุคำศัพท์ในไฟล์ไวยากรณ์ ให้ดูที่ คู่มืออ้างอิง Speakeasy

หากต้องการใช้การวินิจฉัยเสียงพูด:

•หากต้องการเปิดการวินิจฉัยเสียงพูดในไคลเอ็นต์ Velocity ให้ไปที่ เมนู > การวินิจฉัยเสียงพูด

•หากต้องการทดสอบเทียบกับชุดวลีที่เจาะจง ให้ใช้เมนูดรอปดาวน์ ไวยากรณ์ เพื่อเลือกไฟล์ไวยากรณ์

•หากต้องการหยุดการจำแนกเสียงพูดชั่วคราว ให้ตั้งค่าตัวเลือก การตรวจจับเสียงพูด ที่ด้านบนของหน้าเป็น ปิด

•หากต้องการปรับแต่งการตรวจจับ เพื่อให้ Speakeasy ตรวจจับเสียงพูดโดยใช้ระดับพลังงานน้อยลง ให้ใช้แถบเลื่อน ขีดจำกัดสัมบูรณ์ แถบสีเขียวที่ด้านบนของหน้า จะแสดงระดับพลังงานที่ตรวจจับในปัจจุบัน และระดับพลังงานเฉลี่ยใน 5 วินาทีที่ผ่านมา ให้พยายามตั้งค่าขีดจำกัดสัมบูรณ์เป็นขีดจำกัดสูงสุดที่ให้ผลลัพธ์ที่ถูกต้องกับคุณอย่างสม่ำเสมอ การตั้งค่าขีดจำกัดพลังงานต่ำเกินไป จะส่งผลให้ Speakeasy ตรวจจับสัญญาณรบกวนพื้นหลังมากขึ้น และอาจส่งคืนผลลัพธ์ที่ไม่ถูกต้องบ่อยขึ้น

•หากต้องการปรับแต่งขีดจำกัดความเชื่อมั่น ให้ใช้แถบเลื่อน ระดับความเชื่อมั่น ให้พยายามตั้งค่าระดับความเชื่อมั่นเป็นขีดจำกัดสูงสุดที่ให้ผลลัพธ์ที่ถูกต้องกับคุณอย่างสม่ำเสมอ