Redação ou identificação de PII em um stream em tempo real - Amazon Transcribe

As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.

Redação ou identificação de PII em um stream em tempo real

Ao redigir informações de identificação pessoal (PII) de uma transcrição de streaming,Amazon Transcribe substitua cada instância identificada de PII pela sua transcrição.[PII]

Uma opção adicional disponível para transcrições de streaming é a identificação de PII. Quando você ativa a Identificação de PII,Amazon Transcribe rotula as PII nos resultados da transcrição sob umEntities objeto. Para obter uma amostra de saída, consulteExemplo de saída de streaming editadaExemplo de saída de identificação PII e.

A redação e a identificação de PII com transcrições de streaming estão disponíveis com esses dialetos em inglês: australiano (en-AU), britânico (en-GB) e americano (en-US).

A identificação e redação de PII para trabalhos de streaming são realizadas somente após a transcrição completa dos segmentos de áudio.

Tipos de PII queAmazon Transcribe você pode reconhecer para transcrições de streaming
Tipo de PII Descrição
ADDRESS

Um endereço físico, como 100 Main Street, Anytown, EUA ou Suite #12, Edifício 123. Um endereço pode incluir uma rua, prédio, localização, cidade, estado, país, condado, CEP, distrito, bairro e muito mais.

ALL

Redija ou identifique todos os tipos de PII listados nesta tabela.

BANK_ACCOUNT_NUMBER

Um número de conta bancária dos EUA. Normalmente, eles têm entre 10 e 12 dígitos, masAmazon Transcribe também reconhecem números de contas bancárias quando apenas os últimos 4 dígitos estão presentes.

BANK_ROUTING

Um número de roteamento de conta bancária dos EUA. Normalmente, eles têm 9 dígitos, masAmazon Transcribe também reconhecem números de roteamento quando apenas os últimos 4 dígitos estão presentes.

CREDIT_DEBIT_CVV

Um código de verificação de cartão (CVV) de 3 dígitos que está presente nos cartões de crédito e débito VISA e Discover. MasterCard Nos cartões de crédito ou débito American Express, é um código numérico de 4 dígitos.

CREDIT_DEBIT_EXPIRY

A data de validade de um cartão de crédito ou débito. Esse número geralmente tem 4 dígitos e é formatado como mês/ano ou MM/AA. Por exemplo,Amazon Transcribe pode reconhecer datas de vencimento, como 21/01, 01/2021 e janeiro de 2021.

CREDIT_DEBIT_NUMBER

O número de um cartão de crédito ou débito. Esses números podem variar de 13 a 16 dígitos, masAmazon Transcribe também reconhecem números de cartão de crédito ou débito quando apenas os últimos 4 dígitos estão presentes.

EMAIL

Um endereço de e-mail, como efua.owusu@email.com.

NAME

O nome de uma pessoa. Esse tipo de entidade não inclui títulos, como Sr., Sra., Senhorita ou Dr.. NãoAmazon Transcribe aplica esse tipo de entidade a nomes que fazem parte de organizações ou endereços. Por exemplo,Amazon Transcribe reconhece a John Doe Organization como uma organização e a Jane Doe Street como um endereço.

PHONE

Um número de telefone. Esse tipo de entidade também inclui números de fax e pager.

PIN

Um número de identificação pessoal (PIN) de 4 dígitos que permite que alguém acesse as informações da conta bancária.

SSN

Um Número de Seguro Social (SSN) é um número de 9 dígitos emitido para cidadãos dos EUA, residentes permanentes e residentes que trabalham temporariamente. Amazon Transcribetambém reconhece números de previdência social quando apenas os últimos 4 dígitos estão presentes.

Você pode iniciar uma transcrição de streaming usando oAWS Management Console WebSocket, ou HTTP/2.

  1. Faça login no AWS Management Console.

  2. No painel de navegação, escolha Transcrição em tempo real. Role para baixo até Configurações de remoção de conteúdo e expanda esse campo se ele estiver minimizado.

    
                    Amazon Transcribecaptura de tela do console: a página de “transcrição em tempo real”.
  3. Ative a opção Identificação e redação de PII.

    
                    Amazon Transcribecaptura de tela do console: o painel expandido de “configurações de remoção de conteúdo”.
  4. Selecione Somente identificação ou Identificação e redação e, em seguida, selecione os tipos de entidade PII que você deseja identificar ou redigir em sua transcrição.

    
                    Amazon Transcribecaptura de tela do console: lista de tipos de PII que podem ser selecionados.
  5. Agora está tudo pronto para transcrever sua transmissão. Selecione Iniciar transmissão e começar a falar. Para finalizar seu ditado, selecione Interromper streaming.

Este exemplo cria um URL preassinado que usa a redação de PII (ou identificação de PII) em um WebSocket stream. Quebras de linha foram adicionadas para uma melhor leitura. Para obter mais informações sobre como usar WebSocket streams comAmazon Transcribe, consulteConfigurando um WebSocket stream. Para obter mais detalhes sobre os parâmetros, consulte StartStreamTranscription.

GET wss://transcribestreaming.us-west-2.amazonaws.com:8443/stream-transcription-websocket? &X-Amz-Algorithm=AWS4-HMAC-SHA256 &X-Amz-Credential=AKIAIOSFODNN7EXAMPLE%2F20220208%2Fus-west-2%2Ftranscribe%2Faws4_request &X-Amz-Date=20220208T235959Z &X-Amz-Expires=300 &X-Amz-Security-Token=security-token &X-Amz-Signature=string &X-Amz-SignedHeaders=content-type%3Bhost%3Bx-amz-date &language-code=en-US &media-encoding=flac &sample-rate=16000 &pii-entity-types=NAME,ADDRESS &content-redaction-type=PII (or &content-identification-type=PII)

Você não pode usar os doiscontent-identification-type econtent-redaction-type na mesma solicitação.

As definições de parâmetros podem ser encontradas na Referência da API; os parâmetros comuns a todas as operaçõesAWS da API estão listados na seção Parâmetros comuns.

Este exemplo cria uma solicitação HTTP/2 com identificação de PII ou redação de PII ativada. Para obter mais informações sobre como usar o streaming HTTP/2 comAmazon Transcribe, consulteConfigurar um fluxo de HTTP/2. Para obter mais detalhes sobre parâmetros e cabeçalhos específicos paraAmazon Transcribe, consulte StartStreamTranscription.

POST /stream-transcription HTTP/2 host: transcribestreaming.us-west-2.amazonaws.com X-Amz-Target: com.amazonaws.transcribe.Transcribe.StartStreamTranscription Content-Type: application/vnd.amazon.eventstream X-Amz-Content-Sha256: string X-Amz-Date: 20220208T235959Z Authorization: AWS4-HMAC-SHA256 Credential=access-key/20220208/us-west-2/transcribe/aws4_request, SignedHeaders=content-type;host;x-amz-content-sha256;x-amz-date;x-amz-target;x-amz-security-token, Signature=string x-amzn-transcribe-language-code: en-US x-amzn-transcribe-media-encoding: flac x-amzn-transcribe-sample-rate: 16000 x-amzn-transcribe-content-identification-type: PII (or x-amzn-transcribe-content-redaction-type: PII) x-amzn-transcribe-pii-entity-types: NAME,ADDRESS transfer-encoding: chunked

Você não pode usar os doiscontent-identification-type econtent-redaction-type na mesma solicitação.

As definições de parâmetros podem ser encontradas na Referência da API; os parâmetros comuns a todas as operaçõesAWS da API estão listados na seção Parâmetros comuns.

nota

A edição de PII para transmissão só tem suporte paraRegiões da AWS: Ásia-Pacífico (Seul), Ásia-Pacífico (Sydney), Ásia-Pacífico (Tóquio), Canadá (Central), UE (Frankfurt), UE (Frankfurt), UE (Irlanda), Ásia-Pacífico (Sydney), Ásia-Pacífico (Tóquio) e Oeste dos EUA (Oregon).