Redazione o identificazione delle PII in un flusso in tempo reale - Amazon Transcribe

Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.

Redazione o identificazione delle PII in un flusso in tempo reale

Quando si eliminano le informazioni di identificazione personale (PII) da una trascrizione in streaming, Amazon Transcribe sostituisce ogni istanza identificata come PII con [PII] nella trascrizione.

Un'opzione aggiuntiva disponibile per le trascrizioni in streaming è l'identificazione delle PII. Quando attivi l'identificazione PII, Amazon Transcribe etichetta le PII nei risultati della trascrizione sotto un oggetto. Entities Per un esempio di output, vedi Esempio di output in streaming redatto e Esempio di output identificativo PII.

La redazione e l'identificazione delle PII con trascrizioni in streaming sono disponibili con questi dialetti inglesi: australiano (en-AU), britannico (), americano (en-GB) e spagnolo (). en-US es-US

L'identificazione e la redazione delle PII per i processi in streaming vengono eseguite solo dopo la trascrizione completa dei segmenti audio.

I tipi di PII sono riconoscibili per le trascrizioni in streaming Amazon Transcribe
Tipo di PII Descrizione
ADDRESS

Un indirizzo fisico, ad esempio 100 Main Street, Anytown, USA o Suite #12, Edificio 123. Un indirizzo può includere una via, un edificio, una posizione, una città, uno stato, una nazione, una contea, un CAP, un distretto, un quartiere e altro ancora.

ALL

Redigi o identifica tutti i tipi di PII elencati in questa tabella.

BANK_ACCOUNT_NUMBER

Numero del conto bancario statunitense. In genere hanno una lunghezza compresa tra 10 e 12 cifre, ma Amazon Transcribe riconosce anche i numeri di conto bancario quando sono presenti solo le ultime 4 cifre.

BANK_ROUTING

Numero di routing del conto bancario statunitense. In genere hanno una lunghezza di 9 cifre, ma Amazon Transcribe riconosce anche i numeri di routing quando sono presenti solo le ultime 4 cifre.

CREDIT_DEBIT_CVV

Un codice di verifica della carta a 3 cifre (CVV) presente sulle carte di credito e debito VISA e Discover MasterCard. Nelle carte di credito o debito American Express, è un codice numerico a 4 cifre.

CREDIT_DEBIT_EXPIRY

Data di scadenza della carta di credito o della carta di debito. Questo numero è in genere composto da 4 cifre e il formato è mese/anno o MM/YY. Ad esempio, Amazon Transcribe può riconoscere date di scadenza come 21/01/2021, 01/2021 e gennaio 2021.

CREDIT_DEBIT_NUMBER

Numeri di carta di credito o di debito. Questi numeri possono variare da 13 a 16 cifre di lunghezza, ma riconoscono Amazon Transcribe anche i numeri delle carte di credito o di debito quando sono presenti solo le ultime 4 cifre.

EMAIL

Un indirizzo e-mail, ad esempio efua.owusu@email.com.

NAME

Il nome di una persona. Questo tipo di entità non include titoli, ad esempio Mr., Mrs., Miss o Dr.. Non Amazon Transcribe applica questo tipo di entità ai nomi che fanno parte di organizzazioni o indirizzi. Ad esempio, Amazon Transcribe riconosce la John Doe Organization come organizzazione e Jane Doe Street come indirizzo.

PHONE

Un numero di telefono. Questo tipo di entità include anche numeri di fax e cercapersone.

PIN

Un codice di identificazione personale a 4 cifre (PIN) che consente a qualcuno di accedere ai dati del proprio conto bancario.

SSN

Un numero di previdenza sociale (SSN) è un numero di 9 cifre rilasciato ai cittadini statunitensi, ai residenti permanenti e ai residenti che lavorano temporaneamente. Amazon Transcribe riconosce anche i numeri di previdenza sociale quando sono presenti solo le ultime 4 cifre.

Puoi avviare una trascrizione in streaming utilizzando AWS Management Console, WebSocket o HTTP/2.

  1. Accedi alla AWS Management Console.

  2. Nel riquadro di navigazione scegli Trascrizione in tempo reale. Scorri verso il basso fino a Impostazioni rimozione dei contenuti ed espandi questo campo se è ridotto al minimo.

    Amazon Transcribe schermata della console: la pagina «trascrizione in tempo reale».
  3. Attiva l'identificazione e la redazione delle PII.

    Amazon Transcribe schermata della console: il pannello espanso «impostazioni di rimozione dei contenuti».
  4. Seleziona Solo identificazione o Identificazione e redazione, quindi seleziona i tipi di entità PII che desideri identificare o redigere nella trascrizione.

    Amazon Transcribe schermata della console: elenco dei tipi di PII che possono essere selezionati.
  5. A questo punto puoi eseguire la trascrizione del flusso. Seleziona Avvia streaming e inizia a parlare. Per terminare la dettatura, seleziona Interrompi streaming.

Questo esempio crea un URL predefinito che utilizza la redazione delle PII (o l'identificazione PII) in uno stream. WebSocket Le interruzioni di riga sono state aggiunte per la leggibilità. Per ulteriori informazioni sull'utilizzo degli WebSocket stream con, consulta. Amazon TranscribeConfigurazione di uno WebSocket stream Per ulteriori dettagli sui parametri, consulta StartStreamTranscription.

GET wss://transcribestreaming.us-west-2.amazonaws.com:8443/stream-transcription-websocket? &X-Amz-Algorithm=AWS4-HMAC-SHA256 &X-Amz-Credential=AKIAIOSFODNN7EXAMPLE%2F20220208%2Fus-west-2%2Ftranscribe%2Faws4_request &X-Amz-Date=20220208T235959Z &X-Amz-Expires=300 &X-Amz-Security-Token=security-token &X-Amz-Signature=string &X-Amz-SignedHeaders=content-type%3Bhost%3Bx-amz-date &language-code=en-US &media-encoding=flac &sample-rate=16000 &pii-entity-types=NAME,ADDRESS &content-redaction-type=PII (or &content-identification-type=PII)

Non è possibile utilizzare sia content-identification-type che content-redaction-type nella stessa richiesta.

Le definizioni dei parametri sono disponibili nell'API Reference; i parametri comuni a tutte le operazioni AWS API sono elencati nella sezione Parametri comuni.

Questo esempio crea una richiesta HTTP/2 con l'identificazione delle PII abilitata. Per ulteriori informazioni sull'utilizzo dello streaming HTTP/2 con Amazon Transcribe, consulta. Configurazione di uno HTTP stream /2 Per ulteriori dettagli sui parametri e sulle intestazioni specifici di, consulta. Amazon TranscribeStartStreamTranscription

POST /stream-transcription HTTP/2 host: transcribestreaming.us-west-2.amazonaws.com X-Amz-Target: com.amazonaws.transcribe.Transcribe.StartStreamTranscription Content-Type: application/vnd.amazon.eventstream X-Amz-Content-Sha256: string X-Amz-Date: 20220208T235959Z Authorization: AWS4-HMAC-SHA256 Credential=access-key/20220208/us-west-2/transcribe/aws4_request, SignedHeaders=content-type;host;x-amz-content-sha256;x-amz-date;x-amz-target;x-amz-security-token, Signature=string x-amzn-transcribe-language-code: en-US x-amzn-transcribe-media-encoding: flac x-amzn-transcribe-sample-rate: 16000 x-amzn-transcribe-content-identification-type: PII (or x-amzn-transcribe-content-redaction-type: PII) x-amzn-transcribe-pii-entity-types: NAME,ADDRESS transfer-encoding: chunked

Non è possibile utilizzare sia content-identification-type che content-redaction-type nella stessa richiesta.

Le definizioni dei parametri sono disponibili nell'API Reference; i parametri comuni a tutte le operazioni AWS API sono elencati nella sezione Parametri comuni.

Nota

La redazione delle informazioni personali per lo streaming è supportata solo in Regioni AWS: Asia Pacifico (Seoul), Asia Pacifico (Sydney), Asia Pacifico (Tokyo), Canada (Centrale), UE (Francoforte), UE (Irlanda), UE (Londra), Stati Uniti orientali (Virginia settentrionale), Stati Uniti orientali (Ohio) e Stati Uniti occidentali (Oregon).