O que é o Amazon Transcribe? - Amazon Transcribe

As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.

O que é o Amazon Transcribe?

O Amazon Transcribe usa tecnologias de machine learning avançadas para reconhecer a fala em áudio ou vídeo e transcrevê-la em texto. Você pode usar o Amazon Transcribe para converter áudio em texto e para criar aplicativos que incorporam o conteúdo de arquivos de áudio. Por exemplo, é possível transcrever a faixa de áudio de uma gravação de vídeo para criar legendas para o vídeo.

Você também pode fornecer a Amazon Transcribe com arquivos de vídeo e transcrever o áudio diretamente desses arquivos. Por exemplo, você pode fornecer o Amazon Transcribe com um arquivo de vídeo MP4, e ele transcreverá o áudio diretamente desse arquivo. Para obter informações sobre contêineres de arquivos e formatos disponíveis, consulteEntrada de voz.

A lista a seguir mostra os idiomas disponíveis para transcrição em lote. Cada língua tem o seu próprioCódigo do idioma, que é mostrado entre parênteses ao lado do idioma. Use o código de idioma para especificar o idioma do arquivo de áudio ou vídeo.

  • Árabe do Golfo (ar-AE)

  • Árabe padrão moderno (ar-SA)

  • Mandarim (China Continental) (zh-CN)

  • Holandês (nl-NL)

  • Inglês australiano (en-AU)

  • Inglês britânico (en-GB)

  • Inglês indiano (es-IN)

  • Inglês irlandês (en-IE)

  • Inglês escocês (en-AB)

  • Inglês EUA (en-US)

  • Inglês galês (en-WL)

  • Espanhol (es-ES)

  • Espanhol dos EUA (es-US)

  • Francês (fr-FR)

  • Francês canadense (fr-CA)

  • Persa (fa-IR)

  • Alemão (de-DE)

  • Suíço-alemão (de-CH)

  • Hebraico (he-IL)

  • Hindi indiano (hi-IN)

  • Indonésio (id-ID)

  • Italiano (it-IT)

  • Japonês (ja-JP)

  • Coreano (ko-KR)

  • Malaio (ms-MY)

  • Português (pt-PT)

  • Português do Brasil (pt-BR)

  • Russo (ru-RU)

  • Tâmil (ta-IN)

  • Telugo (te-IN)

  • Turco (tr-TR)

Você pode transcrever streaming de áudio nos seguintes idiomas. Para especificar um idioma no streaming em tempo real, use umCódigo do idioma. Os códigos de idioma são mostrados entre parênteses ao lado dos idiomas.

  • Mandarim (China Continental) (zh-CN)

  • Inglês australiano (en-AU)

  • Inglês britânico (en-GB)

  • Inglês EUA (en-US)

  • Francês (fr-FR)

  • Francês canadense (fr-CA)

  • Alemão (de-DE)

  • Italiano (it-IT)

  • Japonês (ja-JP)

  • Coreano (ko-KR)

  • Português do Brasil (pt-BR)

  • Espanhol dos EUA (es-US)

Você pode usar o Amazon Transcribe com outrosAWSPara criar aplicativos. Por exemplo, é possível:

  • Use o Amazon Transcribe para converter voz em texto, enviar o texto para o Amazon Translate para traduzi-lo para outro idioma e enviar o texto traduzido para o Amazon Polly para leitura em voz alta do texto traduzido.

  • Use o Amazon Transcribe para transcrever gravações de chamadas de atendimento ao cliente para análise. Depois de transcrever uma gravação, envie a transcrição para o Amazon Comprehend para identificar palavras-chave, tópicos ou sentimentos.

  • Use o Amazon Transcribe para transcrever transmissões ao vivo, como a televisão, para fornecer legendas em tempo real. Amazon Transcribe pode exigir personalização adicional ou supervisão humana para aplicativos de nível de transmissão.

Para usar o Amazon Transcribe, armazene o arquivo de áudio em um bucket do Amazon S3. A saída do trabalho de transcrição também é armazenada em um bucket do S3. O conteúdo entregue aos buckets do Amazon S3 pode conter conteúdo do cliente. Para obter mais informações sobre a remoção de dados confidenciais, consulteComo eu faço para esvaziar um bucket do S3?ouComo eu faço para excluir um bucket do S3?.

Reconhecer vozes

O Amazon Transcribe pode identificar oradores individuais em um clipe de áudio, uma técnica conhecida comodiarização do orador. Ao ativar a diarização do orador, o Amazon Transcribe inclui um atributo que identifica cada orador no clipe de áudio. Você pode usar a diarização do orador para:

  • identificar o cliente e o representante de suporte em uma gravação de chamada de atendimento ao cliente

  • identificar personagens para legendas

  • identificar o orador e os autores das perguntas em uma coletiva de imprensa ou palestra gravada

Você pode especificar o número de vozes que deseja que o Amazon Transcribe reconheça em um clipe de áudio.

Transcrevendo canais de áudio separados

Para criar uma transcrição para cada canal ou streaming único de som gravado em um arquivo de áudio, use a identificação de canal. Com a identificação de canal, o Amazon Transcribe retorna duas ou mais transcrições: uma transcrição combinada de todos os canais de áudio e transcrição de cada canal de áudio.

Use a identificação de canal quando o áudio estiver em vários canais. Por exemplo, use identificação de canal:

  • Quando a gravação tiver um representante do atendimento ao cliente em um canal e um cliente em outro

  • Ao transcrever um podcast em que o apresentador está gravado em um canal e o convidado em outro

Para obter mais informações sobre a identificação de canal, consulte Transcrevendo áudio multicanal.

Transcrever streaming de áudio

Você pode usar o Amazon Transcribe para transcrever streaming de áudio em tempo real. Você envia ao Amazon Transcribe um streaming de áudio e o Amazon Transcribe retorna um streaming de objetos JSON com a transcrição do áudio.

Para obter mais informações sobre como processar streaming de áudio, consulte Transcrição de streaming.

Vocabulário personalizado

Crie um vocabulário personalizado para ajudar o Amazon Transcribe a reconhecer palavras que são específicas do seu caso de uso e melhorar a precisão na conversão de fala em texto. Por exemplo, você pode criar um vocabulário personalizado que inclui palavras e expressões específicas do setor.

Use um vocabulário personalizado para ajudar o Amazon Transcribe a reconhecer:

  • palavras que não estão sendo reconhecidas

  • palavras desconhecidas que são específicas do seu domínio

Para obter mais informações sobre a criação de um vocabulário personalizado, consulte Vocabulários personalizados.

Você está usando o Amazon Transcribe pela primeira vez?

Caso seja um usuário iniciante, recomendamos que você leia as seções a seguir em ordem:

  1. Como o Amazon Transcribe funciona—Apresenta a Amazon Transcribe.

  2. Conceitos básicos Amazon Transcribe—Explica como configurar oAWSe usar o Amazon Transcribe.

  3. Referência de API- Contém a documentação de referência das operações do Amazon Transcribe.