Rédaction ou identification des informations personnelles dans un flux en temps réel - Amazon Transcribe

Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.

Rédaction ou identification des informations personnelles dans un flux en temps réel

Lorsque vous supprimez des informations personnelles identifiables (PII) à partir d'une transcription en continuAmazon Transcribe, remplacez chaque instance identifiée de PII par celle[PII] figurant dans votre transcription.

Une autre option disponible pour les transcriptions en continu est l'identification des informations personnelles. Lorsque vous activez l'identification des informations personnelles,Amazon Transcribe étiquetez les informations personnelles dans vos résultats de transcription sous unEntities objet. Pour un exemple de sortie, reportez-vousExemple de sortie de streaming expurgée aux sections etExemple de sortie d'identification PII.

La rédaction et l'identification des informations personnelles à l'aide de transcriptions en streaming sont disponibles dans les dialectes anglais suivants : australien (en-AUen-GB), britannique () et américain (en-US).

L'identification et la rédaction des informations personnelles pour les tâches de streaming ne sont effectuées qu'après la transcription complète des segments audio.

Les types d'informations personnelles queAmazon Transcribe vous pouvez reconnaître pour les transcriptions en streaming
Type de PII Description
ADDRESS

Une adresse physique, telle que 100 Main Street, Anytown, États-Unis ou Suite #12, bâtiment 123. Une adresse peut inclure une rue, un bâtiment, un lieu, une ville, un état, un pays, un comté, un code postal, une circonscription, un quartier, etc.

ALL

Rédigez ou identifiez tous les types d'informations personnelles répertoriés dans ce tableau.

BANK_ACCOUNT_NUMBER

Numéro de compte bancaire américaine. Ils comportent généralement entre 10 et 12 chiffres, mais ils reconnaissentAmazon Transcribe également les numéros de compte bancaire lorsque seuls les 4 derniers chiffres sont présents.

BANK_ROUTING

Un numéro de routage d'un compte bancaire américain. Ils comportent généralement 9 chiffres, mais ils reconnaissentAmazon Transcribe également les numéros de routage lorsque seuls les 4 derniers chiffres sont présents.

CREDIT_DEBIT_CVV

Code de vérification de carte (CVV) à 3 chiffres présent sur les cartes de crédit et de débit VISA et Discover. MasterCard Dans les cartes de crédit ou de débit American Express, il s'agit d'un code numérique à 4 chiffres.

CREDIT_DEBIT_EXPIRY

Date d'expiration d'une carte de crédit ou de débit. Ce numéro comporte généralement 4 chiffres et est formaté comme mois/année ou MM/AA. Par exemple,Amazon Transcribe peut reconnaître des dates d'expiration telles que 01/21, 01/2021 et janvier 2021.

CREDIT_DEBIT_NUMBER

Numéro d'une carte de crédit ou de débit. La longueur de ces numéros peut varier de 13 à 16 chiffres, mais ils reconnaissentAmazon Transcribe également les numéros de carte de crédit ou de débit lorsque seuls les 4 derniers chiffres sont présents.

EMAIL

Une adresse e-mail, telle que efua.owusu@email.com.

NAME

Le nom d'une personne. Ce type d'entité n'inclut pas les titres, tels que M., Mme, Mlle ou Dr. IlAmazon Transcribe n'applique pas ce type d'entité aux noms faisant partie d'organisations ou d'adresses. Par exemple,Amazon Transcribe reconnaît la John Doe Organization en tant qu'organisation et Jane Doe Street en tant qu'adresse.

PHONE

Numéro de téléphone. Ce type d'entité inclut également les numéros de télécopie et de téléavertisseur.

PIN

Numéro d'identification personnel (PIN) à 4 chiffres qui permet à une personne d'accéder aux informations de son compte bancaire.

SSN

Un numéro de sécurité sociale (SSN) est un numéro à 9 chiffres qui est délivré aux citoyens américains, aux résidents permanents et aux résidents actifs temporaires. Amazon Transcribereconnaît également les numéros de sécurité sociale lorsque seuls les 4 derniers chiffres sont présents.

Vous pouvez démarrer une transcription en continu à l'aide duAWS Management Console WebSocket, ou HTTP/2.

  1. Connectez-vous au AWS Management Console.

  2. Dans le panneau de navigation, choisissez Transcription en temps réel. Faites défiler l'écran vers le bas jusqu'à Paramètres de suppression de contenu et agrandissez ce champ s'il est réduit.

    
                    Amazon Transcribecapture d'écran de la console : la page de « transcription en temps réel ».
  3. Activez l'identification et la rédaction des informations personnelles.

    
                    Amazon Transcribecapture d'écran de la console : le panneau étendu des « paramètres de suppression de contenu ».
  4. Sélectionnez Identification uniquement ou Identification et rédaction, puis sélectionnez les types d'entités PII que vous souhaitez identifier ou supprimer dans votre transcription.

    
                    Amazon Transcribecapture d'écran de la console : liste des types d'informations personnelles pouvant être sélectionnés.
  5. Voici le moment pour transcrire votre stream. Sélectionnez Démarrer la diffusion et commencez à parler. Pour mettre fin à votre dictée, sélectionnez Arrêter la diffusion.

Cet exemple crée une URL présignée qui utilise la rédaction d'informations personnelles (ou identification d'informations personnelles) dans un WebSocket flux. Les sauts de ligne ont été ajoutés pour faciliter la lecture. Pour plus d'informations sur l'utilisation WebSocket des flux avecAmazon Transcribe, consultezConfiguration d'un WebSocket stream. Pour plus de détails sur les paramètres, reportez-vous à la section StartStreamTranscription.

GET wss://transcribestreaming.us-west-2.amazonaws.com:8443/stream-transcription-websocket? &X-Amz-Algorithm=AWS4-HMAC-SHA256 &X-Amz-Credential=AKIAIOSFODNN7EXAMPLE%2F20220208%2Fus-west-2%2Ftranscribe%2Faws4_request &X-Amz-Date=20220208T235959Z &X-Amz-Expires=300 &X-Amz-Security-Token=security-token &X-Amz-Signature=string &X-Amz-SignedHeaders=content-type%3Bhost%3Bx-amz-date &language-code=en-US &media-encoding=flac &sample-rate=16000 &pii-entity-types=NAME,ADDRESS &content-redaction-type=PII (or &content-identification-type=PII)

Vous ne pouvez pas utilisercontent-identification-type les deuxcontent-redaction-type dans la même demande.

Les définitions de paramètres se trouvent dans la référence de l'API ; les paramètres communs à toutes les opérations de l'AWSAPI sont répertoriés dans la section Paramètres communs.

Cet exemple crée une requête HTTP/2 avec l'identification des informations personnelles ou la rédaction des informations personnelles activées. Pour plus d'informations sur l'utilisation du streaming HTTP/2 avecAmazon Transcribe, consultezConfiguration d’un flux HTTP/2. Pour plus de détails sur les paramètres et les en-têtes spécifiques àAmazon Transcribe, consultez StartStreamTranscription.

POST /stream-transcription HTTP/2 host: transcribestreaming.us-west-2.amazonaws.com X-Amz-Target: com.amazonaws.transcribe.Transcribe.StartStreamTranscription Content-Type: application/vnd.amazon.eventstream X-Amz-Content-Sha256: string X-Amz-Date: 20220208T235959Z Authorization: AWS4-HMAC-SHA256 Credential=access-key/20220208/us-west-2/transcribe/aws4_request, SignedHeaders=content-type;host;x-amz-content-sha256;x-amz-date;x-amz-target;x-amz-security-token, Signature=string x-amzn-transcribe-language-code: en-US x-amzn-transcribe-media-encoding: flac x-amzn-transcribe-sample-rate: 16000 x-amzn-transcribe-content-identification-type: PII (or x-amzn-transcribe-content-redaction-type: PII) x-amzn-transcribe-pii-entity-types: NAME,ADDRESS transfer-encoding: chunked

Vous ne pouvez pas utilisercontent-identification-type les deuxcontent-redaction-type dans la même demande.

Les définitions de paramètres se trouvent dans la référence de l'API ; les paramètres communs à toutes les opérations de l'AWSAPI sont répertoriés dans la section Paramètres communs.

Note

La rédaction d'informations d'identification personnelle pour le streaming est prise en charge uniquement dans les régions suivantesRégions AWS : Asie-Pacifique (Séoul), Asie-Pacifique (Sydney), Asie-Pacifique (Tokyo), Canada (Centre), UE (Francfort), UE (Irlande), UE (Londres), USA Est (Virginie du Nord), USA Est (Ohio) et USA Ouest (Oregon).