Editar ou identificar PII em um fluxo em tempo real - Amazon Transcribe

As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.

Editar ou identificar PII em um fluxo em tempo real

Ao editar informações de identificação pessoal (PII) em uma transcrição de streaming, o Amazon Transcribe substitui cada caso de PII identificado por [PII] na transcrição.

Uma opção adicional disponível para transcrições de streaming é a identificação de PII. Quando você ativa a identificação de PII, Amazon Transcribe rotula as PII nos resultados da transcrição sob um objeto. Entities Para obter um exemplo de saída, consulte Exemplo de saída de streaming editada e Exemplo de saída de identificação PII.

A redação e identificação de PII com transcrições de streaming estão disponíveis nos seguintes dialetos em inglês: australiano (en-AU), britânico (), EUA (en-GB) e espanhol (dialeto americanoen-US). es-US

A identificação e a edição de PII para trabalhos de streaming são realizadas somente após a transcrição completa dos segmentos de áudio.

Tipos de PII que Amazon Transcribe podem ser reconhecidos para transcrições de streaming
Tipo de PII Descrição
ADDRESS

Um endereço físico, como 100 Main Street, Anytown, USA ou Suite #12, Building 123. Um endereço pode incluir rua, prédio, local, cidade, estado, país, condado, CEP, jurisdição, bairro e muito mais.

ALL

Reduza ou identifique todos os tipos de PII listados nesta tabela.

BANK_ACCOUNT_NUMBER

Um número de conta bancária dos EUA. Normalmente, eles têm entre 10 e 12 dígitos, mas o Amazon Transcribe também reconhece números de contas bancárias quando somente os últimos quatro dígitos estão presentes.

BANK_ROUTING

Um número de roteamento de conta bancária dos EUA. Normalmente, eles têm nove dígitos, mas o Amazon Transcribe também reconhece números de roteamento quando apenas os últimos quatro dígitos estão presentes.

CREDIT_DEBIT_CVV

Um código de verificação de cartão (CVV) de 3 dígitos que está presente nos cartões de crédito e débito VISA e Discover. MasterCard Nos cartões de crédito ou débito da American Express, é um código numérico de quatro dígitos.

CREDIT_DEBIT_EXPIRY

Data de validade do cartão de crédito ou débito. Esse número geralmente tem quatro dígitos e é formatado como mês/ano ou MM/AA. Por exemplo, Amazon Transcribe pode reconhecer datas de vencimento como 21/01, 01/2021 e janeiro de 2021.

CREDIT_DEBIT_NUMBER

O número de um cartão de crédito ou débito. Esses números podem variar de 13 a 16 dígitos, mas Amazon Transcribe também reconhecem números de cartão de crédito ou débito quando somente os últimos 4 dígitos estão presentes.

EMAIL

Um endereço de e-mail, como efua.owusu@email.com.

NAME

O nome de uma pessoa. Esse tipo de entidade não inclui títulos, como Sr., Sra., Senhorita ou Dr.. Não Amazon Transcribe aplica esse tipo de entidade a nomes que fazem parte de organizações ou endereços. Por exemplo, Amazon Transcribe reconhece a John Doe Organization como uma organização e a Jane Doe Street como um endereço.

PHONE

Um número de telefone. Esse tipo de entidade também inclui números de fax e pager.

PIN

Um número de identificação pessoal (PIN) de quatro dígitos que permite que alguém acesse as informações da conta bancária.

SSN

Um Número de Seguro Social (SSN) é um número de 9 dígitos emitido para cidadãos dos EUA, residentes permanentes e residentes temporários que trabalham. Amazon Transcribe também reconhece números de previdência social quando apenas os últimos 4 dígitos estão presentes.

Você pode iniciar uma transcrição de streaming usando o AWS Management Console WebSocket, ou HTTP/2.

  1. Faça login no AWS Management Console.

  2. No painel de navegação, escolha Transcrição em tempo real. Role para baixo até Configurações de remoção de conteúdo e expanda esse campo se ele estiver minimizado.

    Amazon Transcribe captura de tela do console: a página de 'transcrição em tempo real'.
  3. Ative a Identificação e ocultação de PII.

    Amazon Transcribe captura de tela do console: o painel expandido de “configurações de remoção de conteúdo”.
  4. Selecione Somente identificação ou Identificação e ocultação e escolha os tipos de entidade de PII que você deseja identificar ou editar na transcrição.

    Amazon Transcribe captura de tela do console: lista de tipos de PII que podem ser selecionados.
  5. Agora está tudo pronto para transcrever seu fluxo. Selecione Iniciar transmissão e comece a falar. Para finalizar o ditado, selecione Interromper transmissão.

Este exemplo cria uma URL pré-assinada que usa a redação de PII (ou identificação de PII) em um stream. WebSocket Quebras de linha foram adicionadas para uma melhor leitura. Para obter mais informações sobre o uso de WebSocket fluxos com Amazon Transcribe, consulteConfigurando um WebSocket stream. Para obter mais detalhes sobre os parâmetros, consulte StartStreamTranscription.

GET wss://transcribestreaming.us-west-2.amazonaws.com:8443/stream-transcription-websocket? &X-Amz-Algorithm=AWS4-HMAC-SHA256 &X-Amz-Credential=AKIAIOSFODNN7EXAMPLE%2F20220208%2Fus-west-2%2Ftranscribe%2Faws4_request &X-Amz-Date=20220208T235959Z &X-Amz-Expires=300 &X-Amz-Security-Token=security-token &X-Amz-Signature=string &X-Amz-SignedHeaders=content-type%3Bhost%3Bx-amz-date &language-code=en-US &media-encoding=flac &sample-rate=16000 &pii-entity-types=NAME,ADDRESS &content-redaction-type=PII (or &content-identification-type=PII)

Não é possível usar content-identification-type e content-redaction-type na mesma solicitação.

As definições de parâmetros podem ser encontradas na Referência da API; os parâmetros comuns a todas as operações AWS da API estão listados na seção Parâmetros comuns.

Este exemplo cria uma solicitação HTTP/2 com a identificação de PII ou a edição de PII habilitada. Para obter mais informações sobre como usar o streaming HTTP/2 com Amazon Transcribe, consulte. Configurar um fluxo de HTTP/2 Para obter mais detalhes sobre parâmetros e cabeçalhos específicos de Amazon Transcribe, consulte StartStreamTranscription.

POST /stream-transcription HTTP/2 host: transcribestreaming.us-west-2.amazonaws.com X-Amz-Target: com.amazonaws.transcribe.Transcribe.StartStreamTranscription Content-Type: application/vnd.amazon.eventstream X-Amz-Content-Sha256: string X-Amz-Date: 20220208T235959Z Authorization: AWS4-HMAC-SHA256 Credential=access-key/20220208/us-west-2/transcribe/aws4_request, SignedHeaders=content-type;host;x-amz-content-sha256;x-amz-date;x-amz-target;x-amz-security-token, Signature=string x-amzn-transcribe-language-code: en-US x-amzn-transcribe-media-encoding: flac x-amzn-transcribe-sample-rate: 16000 x-amzn-transcribe-content-identification-type: PII (or x-amzn-transcribe-content-redaction-type: PII) x-amzn-transcribe-pii-entity-types: NAME,ADDRESS transfer-encoding: chunked

Não é possível usar content-identification-type e content-redaction-type na mesma solicitação.

As definições de parâmetros podem ser encontradas na Referência da API; os parâmetros comuns a todas as operações AWS da API estão listados na seção Parâmetros comuns.

nota

A redação de PII para streaming só é suportada nestas áreas Regiões da AWS: Ásia-Pacífico (Seul), Ásia-Pacífico (Sydney), Ásia-Pacífico (Tóquio), Canadá (Central), UE (Frankfurt), UE (Irlanda), UE (Londres), Leste dos EUA (Norte da Virgínia), Leste dos EUA (Ohio) e Oeste dos EUA (Oregon).