Configurações de voz

No perfil do host, a guia Host > Voz permite configurar a conversão de texto em fala e de fala em texto.

Para configurar um perfil que use Speakeasy com o Velocity, você deve instalar o Speakeasy Tools no mesmo local do Velocity Console. Para obter informações sobre a instalação do Speakeasy, consulte Usando Speakeasy.

Speakeasy. Habilite o Speakeasy.

O Accuspeech foi preterido como provedor de voz no Velocity 2.1.34.

Idioma para prompts de voz. Especifica o pacote de idioma de texto para fala ao usar recursos de voz. Quando especificado, todo o texto lido usa a pronúncia do idioma selecionado. O Speakeasy é capaz de interpretar sotaques e caracteres especiais relevantes para esse idioma. Se o idioma selecionado não for suportado, todo o texto será lido como se fosse inglês.

Voz. Especifica o arquivo de voz a ser usado no texto para fala. As vozes nessa lista dependem da seleção em Idioma para comandos de voz. As versões compactas das seguintes vozes estão incluídas no .apk do Speakeasy: 

Inglês EUA - Ava (F)

Inglês EUA - Samantha (F)

Inglês EUA - Tom (M)

Espanhol México - Juan (M)

Espanhol México - Paulina (F)

Para ter outras vozes, ou a versão completa dessas vozes, você deve instalar o respectivo pacote de idioma para conversão de texto em fala, que pode ser baixado na página de downloads do Speakeasy.

Idioma para reconhecimento de voz. Especifica o pacote de idioma de fala para texto ao usar recursos de voz. Quando configurado, o Velocity Client escuta apenas os comandos de voz nesse idioma. O mecanismo de idiomas é capaz de interpretar acentos e caracteres especiais relevantes para esse idioma.

As opções para Inglês EUA e Espanhol México estão incluídas no .apk do Speakeasy e não requerem arquivos adicionais para serem implantadas no projeto.

Volume inicial. Define o nível de volume para voz de fala para texto. Os níveis de volume são medidos em porcentagem. Por padrão, ele é definido como 80. Pode ser controlado por meio de comandos de voz.

Log de voz. Habilita o log de SST (como fluxos de áudio bruto) a partir do mecanismo de voz. Esse log pode conter no máximo 1.000 amostras. Em dispositivos Android, os logs de áudio são salvos na pasta com.wavelink.velocity.

Usar perfis de voz. Permite ao usuário treinar o mecanismo Speakeasy para reconhecer a pronúncia individual de termos específicos. O administrador que habilita perfis de voz fornece uma lista de termos que o usuário pode treinar. Quando o usuário cria um perfil de voz, recebe uma lista de termos a serem pronunciados, e o mecanismo cria a transcrição do que o usuário diz. Em seguida, o mecanismo usa essa transcrição como pronúncia alternativa para o termo. Cada dispositivo só pode ter um perfil de voz por vez. Para obter mais informações, consulte Perfis de voz para Speakeasy.

Depois de habilitar o Speakeasy, você pode criar itens de menu de contexto para ele. Você também pode associar arquivos de gramática com seu projeto como recursos.