Expurgation ou identification des données d’identification personnelle (PII) dans un flux en temps réel - Amazon Transcribe

Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.

Expurgation ou identification des données d’identification personnelle (PII) dans un flux en temps réel

Lorsque vous expurgez des données d’identification personnelle (PII) d’une transcription en streaming, Amazon Transcribe remplace chaque instance identifiée de PII par [PII] dans votre transcription.

L’identification des PII est une autre option disponible pour les transcriptions en streaming. Lorsque vous activez l'identification des informations personnelles, les Amazon Transcribe étiquette dans vos résultats de transcription sous un Entities objet. Pour un exemple de sortie, consultez les sections Exemple de sortie de streaming expurgée et Exemple de sortie d'identification PII.

La rédaction et l'identification des informations personnelles à l'aide de transcriptions en streaming sont disponibles dans les dialectes anglais suivants : australien (en-AU), britannique (), américain (en-GB) et espagnol (dialecte américainen-US) (). es-US

L’identification et l’expurgation des PII pour les tâches en streaming ne sont effectuées qu’après transcription complète des segments audio.

Les types de données personnelles que Amazon Transcribe vous pouvez reconnaître pour les transcriptions en streaming
Type de PII Description
ADDRESS

Adresse physique, telle que 100 Main Street, Anytown, États-Unis ou Suite n°12, bâtiment 123. Une adresse peut inclure une rue, un bâtiment, un emplacement, une ville, un état, un pays, un comté, un code postal, une circonscription, un quartier, etc.

ALL

Expurgez ou identifiez tous les types de PII répertoriés dans ce tableau.

BANK_ACCOUNT_NUMBER

Numéro du compte bancaire aux États-Unis. Il s’agit généralement d’un numéro composé de 10 à 12 chiffres, mais Amazon Transcribe reconnaît également les numéros de compte bancaire lorsque seuls les 4 derniers chiffres sont présents.

BANK_ROUTING

Numéro d’acheminement du compte bancaire aux États-Unis. Il s’agit généralement d’un numéro à 9 chiffres, mais Amazon Transcribe reconnaît également les numéros de routage lorsque seuls les 4 derniers chiffres sont présents.

CREDIT_DEBIT_CVV

Code de vérification de carte (CVV) à 3 chiffres présent sur les cartes de crédit et de débit VISA et Discover. MasterCard Sur les cartes de crédit ou de débit American Express, il s’agit d’un code numérique à 4 chiffres.

CREDIT_DEBIT_EXPIRY

Date d’expiration d’une carte de crédit ou de débit. Ce numéro comporte généralement 4 chiffres et est au format mois/année ou MM/AA. Par exemple, Amazon Transcribe peut reconnaître des dates d'expiration telles que le 21/01, le 01/2021 et le 1er janvier 2021.

CREDIT_DEBIT_NUMBER

Numéro de carte de crédit ou de débit. La longueur de ces numéros peut varier de 13 à 16 chiffres, mais ils reconnaissent Amazon Transcribe également les numéros de carte de crédit ou de débit lorsque seuls les 4 derniers chiffres sont présents.

EMAIL

Adresse e-mail, telle que efua.owusu@email.com.

NAME

Nom d’une personne. Ce type d'entité n'inclut pas les titres, tels que M., Mme, Miss ou Dr. Il Amazon Transcribe n'applique pas ce type d'entité aux noms qui font partie d'organisations ou d'adresses. Par exemple, Amazon Transcribe reconnaît l'organisation John Doe en tant qu'organisation et Jane Doe Street en tant qu'adresse.

PHONE

Numéro de téléphone. Ce type d’entité inclut également les numéros de télécopieur et de pager.

PIN

Numéro d’identification personnel (PIN) à 4 chiffres qui permet à une personne d’accéder aux informations de son compte bancaire.

SSN

Un numéro de sécurité sociale (SSN) est un numéro à 9 chiffres délivré aux citoyens américains, aux résidents permanents et aux résidents actifs temporaires. Amazon Transcribe reconnaît également les numéros de sécurité sociale lorsque seuls les 4 derniers chiffres sont présents.

Vous pouvez démarrer une transcription en streaming en utilisant le AWS Management Console WebSocket, ou HTTP/2.

  1. Connectez-vous au AWS Management Console.

  2. Dans le panneau de navigation, choisissez Transcription en temps réel. Faites défiler jusqu’à Paramètres de suppression de contenu et développez ce champ s’il est réduit.

    Amazon Transcribe capture d'écran de la console : la page « transcription en temps réel ».
  3. Activez l’identification et l’expurgation des PII.

    Amazon Transcribe capture d'écran de la console : le panneau étendu des « paramètres de suppression de contenu ».
  4. Sélectionnez Identification uniquement ou Identification et expurgation, puis sélectionnez les types d’entités de PII que vous souhaitez identifier ou expurger dans votre transcription.

    Amazon Transcribe capture d'écran de la console : liste des types d'informations personnelles pouvant être sélectionnés.
  5. Vous êtes prêt à transcrire votre flux. Sélectionnez Démarrer le streaming et commencez à parler. Pour mettre fin à votre dictée, sélectionnez Arrêter le streaming.

Cet exemple crée une URL présignée qui utilise la rédaction des informations personnelles (ou identification des informations personnelles) dans un flux. WebSocket Les sauts de ligne ont été ajoutés pour faciliter la lecture. Pour plus d'informations sur l'utilisation WebSocket des flux avec Amazon Transcribe, consultezConfiguration d'un WebSocket stream. Pour plus de détails sur les paramètres, consultez la section StartStreamTranscription.

GET wss://transcribestreaming.us-west-2.amazonaws.com:8443/stream-transcription-websocket? &X-Amz-Algorithm=AWS4-HMAC-SHA256 &X-Amz-Credential=AKIAIOSFODNN7EXAMPLE%2F20220208%2Fus-west-2%2Ftranscribe%2Faws4_request &X-Amz-Date=20220208T235959Z &X-Amz-Expires=300 &X-Amz-Security-Token=security-token &X-Amz-Signature=string &X-Amz-SignedHeaders=content-type%3Bhost%3Bx-amz-date &language-code=en-US &media-encoding=flac &sample-rate=16000 &pii-entity-types=NAME,ADDRESS &content-redaction-type=PII (or &content-identification-type=PII)

Vous ne pouvez pas utiliser à la fois content-identification-type et content-redaction-type dans la même demande.

Les définitions des paramètres se trouvent dans la référence d'API ; les paramètres communs à toutes les opérations d' AWS API sont répertoriés dans la section Paramètres communs.

Cet exemple crée une requête HTTP/2 avec l’identification ou l’expurgation des PII activée. Pour plus d'informations sur l'utilisation du streaming HTTP/2 avec Amazon Transcribe, consultezConfiguration d’un flux HTTP/2. Pour plus de détails sur les paramètres et les en-têtes spécifiques à Amazon Transcribe, voir StartStreamTranscription.

POST /stream-transcription HTTP/2 host: transcribestreaming.us-west-2.amazonaws.com X-Amz-Target: com.amazonaws.transcribe.Transcribe.StartStreamTranscription Content-Type: application/vnd.amazon.eventstream X-Amz-Content-Sha256: string X-Amz-Date: 20220208T235959Z Authorization: AWS4-HMAC-SHA256 Credential=access-key/20220208/us-west-2/transcribe/aws4_request, SignedHeaders=content-type;host;x-amz-content-sha256;x-amz-date;x-amz-target;x-amz-security-token, Signature=string x-amzn-transcribe-language-code: en-US x-amzn-transcribe-media-encoding: flac x-amzn-transcribe-sample-rate: 16000 x-amzn-transcribe-content-identification-type: PII (or x-amzn-transcribe-content-redaction-type: PII) x-amzn-transcribe-pii-entity-types: NAME,ADDRESS transfer-encoding: chunked

Vous ne pouvez pas utiliser à la fois content-identification-type et content-redaction-type dans la même demande.

Les définitions des paramètres se trouvent dans la référence d'API ; les paramètres communs à toutes les opérations d' AWS API sont répertoriés dans la section Paramètres communs.

Note

La rédaction d'informations personnelles pour le streaming n'est prise en charge que dans les pays suivants Régions AWS : Asie-Pacifique (Séoul), Asie-Pacifique (Sydney), Asie-Pacifique (Tokyo), Canada (centre), UE (Francfort), UE (Irlande), UE (Londres), États-Unis est (Virginie du Nord), États-Unis est (Ohio) et États-Unis ouest (Oregon).