Melhorando a precisão da transcrição com vocabulários e modelos de linguagem personalizados - Amazon Transcribe

As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.

Melhorando a precisão da transcrição com vocabulários e modelos de linguagem personalizados

Se sua mídia contiver termos específicos de domínio ou não padronizados, como nomes de marcas, acrônimos, palavras técnicas e jargões,Amazon Transcribe talvez não capte corretamente esses termos em sua saída de transcrição.

Para corrigir imprecisões de transcrição e personalizar sua saída para seu caso de uso específico, você pode criarVocabulários personalizadosModelos de linguagem personalizados e.

  • Vocabulários personalizadossão projetados para ajustar e impulsionar o reconhecimento e a formatação de palavras específicas em todos os contextos. Isso envolve o fornecimentoAmazon Transcribe de palavras e, opcionalmente, formulários de pronúncia e exibição.

    Se nãoAmazon Transcribe estiver renderizando corretamente termos específicos em suas transcrições, você pode criar um arquivo de vocabulário personalizado que informaAmazon Transcribe como você deseja que esses termos sejam exibidos. Essa abordagem específica de palavras é mais apropriada para corrigir termos como nomes de marcas e acrônimos.

  • Modelos de linguagem personalizadossão projetados para capturar o contexto associado aos termos. Isso envolve o fornecimentoAmazon Transcribe de um grande volume de dados de texto específicos do domínio.

    Se nãoAmazon Transcribe estiver renderizando corretamente os termos técnicos ou estiver usando o homófono incorreto em suas transcrições, você pode criar um modelo de linguagem personalizado que ensineAmazon Transcribe o idioma específico do seu domínio. Por exemplo, um modelo de linguagem personalizado pode aprender quando usar 'floe' (bloco de gelo) versus 'flow' (fluxo linear).

    Essa abordagem sensível ao contexto é mais apropriada para transcrever grandes volumes de discursos específicos de um domínio. Modelos de linguagem personalizados podem produzir melhorias significativas na precisão apenas em relação aos vocabulários personalizados. Ao usar transcrições em lote, você pode incluir um modelo de idioma personalizado e um vocabulário personalizado em sua solicitação.

dica

Para obter a maior precisão de transcrição, use vocabulários personalizados em conjunto com seus modelos de linguagem personalizados.

Para ver um passo a passo em vídeo sobre como criar e usar vocabulários personalizados, consulte:

Para ver um passo a passo em vídeo sobre como criar e usar modelos de linguagem personalizados, consulte: