Vocabulários personalizados - Amazon Transcribe

As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.

Vocabulários personalizados

Use vocabulários personalizados para melhorar a precisão da transcrição de uma ou mais palavras específicas. Geralmente, são termos específicos do domínio, como nomes de marcas e acrônimos, nomes próprios e palavras que o Amazon Transcribe não está processando corretamente.

Os vocabulários personalizados podem ser usados com todos os idiomas oferecidos. Observe que somente os caracteres listados no conjunto de caracteres do seu idioma podem ser usados em um vocabulário personalizado.

Importante

Você é responsável pela integridade de seus dados ao usar o Amazon Transcribe. Não insira informações confidenciais, informações de identificação pessoal (PII) ou informações de saúde protegidas (PHI) em um vocabulário personalizado.

Considerações ao criar um vocabulário personalizado:

  • Você pode ter até 100 arquivos de vocabulário personalizados por Conta da AWS

  • O limite de tamanho para cada arquivo de vocabulário personalizado é de 50 Kb

  • Se estiver usando a API para criar seu vocabulário personalizado, o respectivo arquivo deverá estar no formato de texto (*.txt). Se estiver usando o AWS Management Console, seu arquivo de vocabulário pode estar no formato de texto (*.txt) ou no formato de valores separados por vírgula (*.csv).

  • Cada entrada em um vocabulário personalizado não pode ultrapassar 256 caracteres

  • Para usar um vocabulário personalizado, ele deve ter sido criado da Região da AWS mesma forma que sua transcrição.

dica

Você pode testar seu vocabulário personalizado usando o. AWS Management Console Quando seu vocabulário personalizado estiver pronto para uso, faça login no AWS Management Console, selecione Transcrição em tempo real, vá até Personalizações, ative Vocabulário personalizado e selecione seu vocabulário personalizado na lista suspensa. Em seguida, selecione Iniciar streaming. Fale algumas palavras do vocabulário personalizado via microfone para ver se elas são processadas corretamente.

Tabelas de vocabulário personalizadas versus listas

Importante

Os vocabulários personalizados em formato de lista estão sendo descontinuados. Se você estiver criando um vocabulário personalizado, use o formato de tabela.

As tabelas oferecem mais opções e maior controle sobre a entrada e saída de palavras no vocabulário personalizado. Com tabelas, você deve especificar várias categorias (Phrase and DisplayAs), permitindo que você ajuste a saída.

As listas não têm opções adicionais, então você só pode digitar as entradas conforme quiser que elas apareçam na transcrição, substituindo todos os espaços por hifens.

Todos os AWS SDKs AWS Management Console AWS CLI,, e usam tabelas de vocabulário personalizadas da mesma forma; as listas são usadas de forma diferente para cada método e, portanto, podem exigir formatação adicional para o uso bem-sucedido entre os métodos.

Para obter mais informações, consulte Criar um vocabulário personalizado usando uma tabela e Criação de um vocabulário personalizado usando uma lista.

Para se aprofundar um pouco mais e aprender a usar o Amazon Augmented AI com vocabulários personalizados, consulte:

Operações de API específicas para vocabulários personalizados