PIItâches d'analyse asynchrones (console) - Amazon Comprehend

Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.

PIItâches d'analyse asynchrones (console)

Vous pouvez utiliser la console pour créer des tâches d'analyse asynchrones afin de détecter PII des entités. Pour plus d'informations sur les types d'PIIentités, consultezDétecter PII des entités.

Pour créer une tâche d'analyse
  1. Connectez-vous au AWS Management Console et ouvrez la console Amazon Comprehend à l'adresse https://console.aws.amazon.com/comprehend/

  2. Dans le menu de gauche, choisissez Tâches d'analyse, puis sélectionnez Créer une tâche.

  3. Sous Paramètres de la tâche, attribuez un nom unique à la tâche d'analyse.

  4. Pour le type d'analyse, sélectionnez Informations personnellement identifiables (PII).

  5. Dans Langue, choisissez l'une des langues prises en charge (anglais ou espagnol).

  6. Dans le mode de sortie, sélectionnez l'une des options suivantes :

    • Offsets : le résultat de la tâche renvoie l'emplacement de chaque PII entité.

    • Rédactions : le résultat de la tâche renvoie une copie du texte d'entrée, chaque PII entrée étant expurgée.

  7. (Facultatif) Si vous choisissez Redactions comme mode de sortie, vous pouvez sélectionner les types d'PIIentités à expurger.

  8. Sous Données d'entrée, spécifiez l'emplacement des documents d'entrée dans Amazon S3 :

    • Pour analyser vos propres documents, choisissez Mes documents, puis Browse S3 pour indiquer le chemin d'accès au compartiment ou au dossier contenant vos fichiers.

    • Pour analyser les échantillons fournis par Amazon Comprehend, sélectionnez Example documents. Dans ce cas, Amazon Comprehend utilise un bucket géré par AWS, et vous ne spécifiez pas l'emplacement.

  9. (Facultatif) Dans Format d'entrée, spécifiez l'un des formats suivants pour vos fichiers d'entrée :

    • Un document par fichier — Chaque fichier contient un document d'entrée. C'est la meilleure solution pour les collections de documents volumineux.

    • Un document par ligne — L'entrée est un ou plusieurs fichiers. Chaque ligne d'un fichier est considérée comme un document. C'est la meilleure solution pour les documents courts, tels que les publications sur les réseaux sociaux. Chaque ligne doit se terminer par une ligne d'alimentation (LF,\n), un retour en chariot (CR, \ r), ou les deux (CRLF, \ r\n). Vous ne pouvez pas utiliser le séparateur de ligne UTF -8 (u+2028) pour terminer une ligne.

  10. Sous Données de sortie, choisissez Browse S3. Choisissez le compartiment ou le dossier Amazon S3 dans lequel vous souhaitez qu'Amazon Comprehend écrive les données de sortie produites par l'analyse.

  11. (Facultatif) Pour chiffrer le résultat de sortie de votre tâche, choisissez Chiffrement. Choisissez ensuite d'utiliser une KMS clé associée au compte courant ou une clé provenant d'un autre compte :

    • Si vous utilisez une clé associée au compte courant, choisissez l'alias de clé ou l'ID pour l'ID de KMSclé.

    • Si vous utilisez une clé associée à un autre compte, entrez l'alias ou ARN l'identifiant de la clé sous ID de KMSclé.

      Note

      Pour plus d'informations sur la création et l'utilisation de KMS clés ainsi que sur le chiffrement associé, consultez la section Service de gestion des clés (KMS).

  12. Sous Autorisations d'accès, indiquez un IAM rôle qui :

    • Accorde un accès en lecture à l'emplacement Amazon S3 de vos documents d'entrée.

    • Accorde un accès en écriture à l'emplacement Amazon S3 de vos documents de sortie.

    • Inclut une politique de confiance qui permet au directeur du comprehend.amazonaws.com service d'assumer le rôle et d'obtenir ses autorisations.

    Si vous ne possédez pas encore de IAM rôle doté de ces autorisations et d'une politique de confiance appropriée, choisissez Créer un IAM rôle pour en créer un.

  13. Lorsque vous avez fini de remplir le formulaire, choisissez Créer une tâche pour créer et démarrer la tâche de détection de sujets.

La nouvelle tâche apparaît dans la liste des tâches avec le champ d'état indiquant le statut de la tâche. Le champ peut être IN_PROGRESS destiné à une tâche en cours de traitement, COMPLETED à une tâche terminée avec succès FAILED ou à une tâche comportant une erreur. Vous pouvez cliquer sur une tâche pour obtenir plus d'informations sur la tâche, y compris les messages d'erreur éventuels.

Lorsque la tâche est terminée, Amazon Comprehend stocke les résultats de l'analyse dans l'emplacement Amazon S3 en sortie que vous avez spécifié pour la tâche. Pour une description des résultats de l'analyse, voirDétecter PII des entités.