CreateVocabularyFilter - Transcribe

As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.

CreateVocabularyFilter

Cria um novo filtro personalizado de vocabulário.

Você pode usar filtros de vocabulário personalizados para mascarar, excluir ou sinalizar palavras específicas da sua transcrição. Filtros de vocabulário personalizados são comumente usados para mascarar palavrões nas transcrições.

Cada idioma tem um conjunto de caracteres que contém todos os caracteres permitidos para esse idioma específico. Se você usar caracteres não suportados, sua solicitação de filtro de vocabulário personalizado falhará. Consulte Conjuntos de caracteres para vocabulários personalizados para obter o conjunto de caracteres para seu idioma.

Para obter mais informações, consulte NetBear vocabulário.

Sintaxe da solicitação

{ "LanguageCode": "string", "Tags": [ { "Key": "string", "Value": "string" } ], "VocabularyFilterFileUri": "string", "VocabularyFilterName": "string", "Words": [ "string" ] }

Parâmetros de solicitação

Para obter informações sobre os parâmetros que são comuns a todas as ações, consulte Parâmetros comuns.

A solicitação aceita os dados a seguir no formato JSON.

LanguageCode

O código do idioma que representa o idioma das entradas em seu filtro de vocabulário. Cada filtro de vocabulário personalizado deve conter termos em apenas um idioma.

Um filtro de vocabulário personalizado só pode ser usado para transcrever arquivos no mesmo idioma do filtro. Por exemplo, se você criar um filtro de vocabulário personalizado usando inglês americano (en-US), só poderá aplicar esse filtro a arquivos que contenham áudio em inglês.

Para obter uma lista dos idiomas suportados e seus códigos de idioma associados, consulte a tabela de idiomas suportados.

Tipo: String

Valores válidos: af-ZA | ar-AE | ar-SA | da-DK | de-CH | de-DE | en-AB | en-AU | en-GB | en-IE | en-IN | en-US | en-WL | es-ES | es-US | fa-IR | fr-CA | fr-FR | he-IL | hi-IN | id-ID | it-IT | ja-JP | ko-KR | ms-MY | nl-NL | pt-BR | pt-PT | ru-RU | ta-IN | te-IN | tr-TR | zh-CN | zh-TW | th-TH | en-ZA | en-NZ | vi-VN | sv-SE

Obrigatório: Sim

Tags

Adiciona uma ou mais tags personalizadas, cada uma na forma de um par chave:valor, a um novo filtro de vocabulário personalizado no momento em que você cria esse novo filtro de vocabulário.

Para saber mais sobre como usar tags com o Amazon Transcribe, consulte Recursos de tags.

Tipo: matriz de objetos Tag

Membros da matriz: número mínimo de 1 item. Número máximo de 200 itens.

Obrigatório: não

VocabularyFilterFileUri

A localização do arquivo de texto no Amazon S3 que contém seus termos de filtro de vocabulário personalizados. O URI deve estar localizado daRegião da AWS mesma forma que o recurso que você está chamando.

Veja um exemplo de caminho de URI:s3://DOC-EXAMPLE-BUCKET/my-vocab-filter-file.txt

Observe que, se você incluirVocabularyFilterFileUri em sua solicitação, não poderá usarWords; você deve escolher um ou outro.

Tipo: String

Restrições de tamanho: tamanho mínimo 1. Tamanho máximo de 2000.

Padrão: (s3://|http(s*)://).+

Obrigatório: não

VocabularyFilterName

Um nome exclusivo, escolhido por você, para seu novo filtro de vocabulário personalizado.

Esse nome diferencia maiúsculas de minúsculas, não pode conter espaços e deve ser exclusivo em umConta da AWS. Se você tentar criar um novo filtro de vocabulário personalizado com o mesmo nome de um filtro de vocabulário personalizado existente, você receberá umConflictException erro.

Tipo: String

Restrições de tamanho: tamanho mínimo 1. Tamanho máximo de 200.

Padrão: ^[0-9a-zA-Z._-]+

Obrigatório: Sim

Words

Use esse parâmetro se quiser criar seu filtro de vocabulário personalizado incluindo todos os termos desejados, como valores separados por vírgula, em sua solicitação. A outra opção para criar seu filtro de vocabulário é salvar suas entradas em um arquivo de texto e enviá-las para um bucket do Amazon S3 e, em seguida, especificar a localização do seu arquivo usando oVocabularyFilterFileUri parâmetro.

Observe que, se você incluirWords em sua solicitação, não poderá usarVocabularyFilterFileUri; você deve escolher um ou outro.

Cada idioma tem um conjunto de caracteres que contém todos os caracteres permitidos para esse idioma específico. Se você usar caracteres não suportados, sua solicitação de filtro de vocabulário personalizado falhará. Consulte Conjuntos de caracteres para vocabulários personalizados para obter o conjunto de caracteres para seu idioma.

Tipo: matriz de strings

Membros da matriz: número mínimo de 1 item.

Restrições de tamanho: tamanho mínimo 1. Tamanho máximo de 256.

Obrigatório: não

Sintaxe da resposta

{ "LanguageCode": "string", "LastModifiedTime": number, "VocabularyFilterName": "string" }

Elementos de resposta

Se a ação for bem-sucedida, o serviço reenviará uma resposta HTTP 200.

Os seguintes dados são retornados no formato JSON pelo serviço.

LanguageCode

O código do idioma que você selecionou para seu filtro de vocabulário personalizado.

Tipo: String

Valores válidos: af-ZA | ar-AE | ar-SA | da-DK | de-CH | de-DE | en-AB | en-AU | en-GB | en-IE | en-IN | en-US | en-WL | es-ES | es-US | fa-IR | fr-CA | fr-FR | he-IL | hi-IN | id-ID | it-IT | ja-JP | ko-KR | ms-MY | nl-NL | pt-BR | pt-PT | ru-RU | ta-IN | te-IN | tr-TR | zh-CN | zh-TW | th-TH | en-ZA | en-NZ | vi-VN | sv-SE

LastModifiedTime

A data e a hora em que você criou seu filtro de vocabulário personalizado.

Os carimbos de data e hora estão no formatoYYYY-MM-DD'T'HH:MM:SS.SSSSSS-UTC. Por exemplo,2022-05-04T12:32:58.761000-07:00 representa 12h32 UTC-7 em 4 de maio de 2022.

Type: timestamp

VocabularyFilterName

O nome que você escolheu para seu filtro de vocabulário personalizado.

Tipo: String

Restrições de tamanho: tamanho mínimo 1. Tamanho máximo de 200.

Padrão: ^[0-9a-zA-Z._-]+

Erros

Para obter informações sobre os erros comuns a todas as ações, consulteErros comuns.

BadRequestException

Sua solicitação não passou em um ou mais testes de validação. Isso pode ocorrer quando a entidade que você está tentando excluir não existe ou se está em um estado não terminal (comoIN PROGRESS). Consulte o campo da mensagem de exceção para obter mais informações.

Código de status HTTP: 400

ConflictException

Já existe um recurso com esse nome. Os nomes dos recursos devem ser exclusivos em umConta da AWS.

Código de status HTTP: 400

InternalFailureException

Ocorreu um erro interno. Verifique a mensagem de erro, corrija o problema e tente fazer sua solicitação novamente.

Código de status HTTP: 500

LimitExceededException

Você enviou muitas solicitações ou seu arquivo de entrada é muito longo. Espere antes de repetir sua solicitação ou use um arquivo menor e tente novamente.

Código de status HTTP: 400

Consulte também

Para obter mais informações sobre como usar essa API em um dos AWS SDKs específicos de linguagem, consulte o seguinte: