Didacticiel : Démarrer dans la console Amazon A2I - Amazon SageMaker

Didacticiel : Démarrer dans la console Amazon A2I

Le didacticiel suivant vous montre comment commencer à utiliser Amazon A2I dans la console Amazon A2I.

Le didacticiel vous donne la possibilité d'utiliser Augmented AI avec Amazon Textract pour la vérification des documents, ou Amazon Rekognition pour la vérification du contenu des images.

Prérequis

Pour commencer à utiliser Amazon A2I, vous devez remplir les conditions préalables suivantes.

  • Créez un compartiment Amazon S3 dans la même région AWS que le flux pour vos données d'entrée et de sortie. Par exemple, si vous utilisez Amazon A2I avec Amazon Textract dans la région us-east-1, créez votre compartiment dans la région us-east-1. Pour créer un compartiment, suivez les instructions de la section Create a Bucket (Créer un compartiment) dans le Guide de l'utilisateur de la console Amazon Simple Storage Service.

  • Effectuez l'une des actions suivantes :

    • Si vous voulez suivre le didacticiel à l'aide d'Amazon Textract, téléchargez cet exemple de document et placez-le dans votre compartiment Amazon S3.

    • Si vous voulez suivre le didacticiel à l'aide d'Amazon Rekognition, téléchargez cette image et placez-la dans votre compartiment Amazon S3.

Note

La console Amazon A2I est intégrée à la console SageMaker.

Étape 1 : Créer une équipe de travail

Tout d'abord, créez une équipe de travail dans la console Amazon A2I et ajoutez-vous en tant qu'employé afin de pouvoir prévisualiser la tâche de vérification humaine.

Important

Ce didacticiel utilise une équipe de travail privée. La main-d'œuvre privée Amazon A2I est configurée dans la zone Ground Truth de la console SageMaker et elle est partagée entre Amazon A2I et Ground Truth.

Pour créer une main-d'œuvre privée à l'aide d'e-mails d'employés

  1. Ouvrez la console Amazon SageMaker à l'adresse https://console.aws.amazon.com/sagemaker/.

  2. Dans le panneau de navigation, choisissez Labeling workforces(Mains-d'œuvre de labélisation) sous Ground Truth.

  3. Choisissez Private (Privée), puis Create private team (Créer une équipe privée).

  4. Choisissez Invite new workers by email (Inviter les nouveaux employés par e-mail).

  5. Pour ce tutoriel, saisissez votre e-mail et celui de toutes les autres personnes dont vous voulez qu'elles puissent prévisualiser l'interface utilisateur de la tâche humaine. Collez ou tapez une liste de 50 adresses e-mail au maximum, séparées par des virgules, dans la zone d'adresses e-mail.

  6. Saisissez un nom d'organisation et une adresse e-mail de contact.

  7. Éventuellement, choisissez une rubrique Amazon SNS à laquelle abonner l'équipe pour que les employés soient avertis par e-mail lorsque de nouvelles tâches de labélisation Ground Truth deviennent disponibles. Les notifications Amazon SNS sont prises en charge par Ground Truth, mais pas par Augmented AI. Si vous abonnez des employés à des notifications Amazon SNS, ils recevront uniquement des notifications concernant les tâches de labélisation Ground Truth. Ils ne recevront pas de notifications concernant les tâches Augmented AI.

  8. Choisissez Create private team (Créer une équipe privée).

Si vous vous ajoutez à une équipe de travail privée, vous recevez un e-mail de no-reply@verificationemail.com contenant des informations de connexion. Utilisez le lien figurant dans cet e-mail pour réinitialiser votre mot de passe et vous connecter à votre portail d'employé. C'est là que vos tâches de vérification humaine apparaissent lorsque vous créez une boucle humaine.

Étape 2 : Créer un flux de vérification humaine

Dans cette étape, vous créez un flux de vérification humaine. Chaque flux de vérification humaine est créé pour untype de tâche spécifique. Ce tutoriel vous permet de choisir entre les types de tâches intégrés : Amazon Rekognition et Amazon Textract.

Pour créer un flux de vérification humaine :

  1. Ouvrez la console Augmented AI à l'adresse https://console.aws.amazon.com/a2i pour accéder à la page Human review workflows (Flux de vérification humaine).

  2. Sélectionnez Create human review workflow (Créer un flux de vérification humaine).

  3. Dans Workflow settings (Paramètres de flux), saisissez un Nom de flux, un compartiment S3 et le rôle IAM que vous avez créé pour ce didacticiel, avec la politique gérée AWS AmazonAugmentedAIIntegratedAPIAccess attachée.

  4. Pour Task type (Type de tâche), sélectionnez Textract — Extraction par paire clé-valeur ou Rekognition — Modération des images.

  5. Sélectionnez le type de tâche que vous avez choisi dans le tableau suivant pour obtenir les instructions relatives à ce type de tâche.

    Amazon Textract – Key-value pair extraction

    1. Sélectionnez Trigger a human review for specific form keys based on the form key confidence score or when specific form keys are missing (Déclencher une vérification humaine pour des clés de formulaire spécifiques en fonction de l'indice de confiance de la clé de formulaire ou lorsque des clés de formulaire spécifiques sont manquantes).

    2. Pour Key name (Nom de la clé), saisissez Mail Address.

    3. Définissez le seuil de confiance d'identification entre 0 et 99.

    4. Définissez le seuil de confiance de qualification entre 0 et 99.

    5. Sélectionnez Trigger a human review for all form keys identified by Amazon Textract with confidence scores in a specific range (Déclencher une vérification humaine pour toutes les clés de formulaire identifiées par Amazon Textract avec des indices de confiance figurant dans une plage spécifiée).

    6. Définissez le seuil de confiance d'identification entre 0 et 90.

    7. Définissez le seuil de confiance de qualification entre 0 et 90.

    Cela initie une vérification humaine si Amazon Textract renvoie un indice de confiance inférieur à 99 pour Mail Address et sa clé, ou un indice de confiance inférieur à 90 pour toute paire clé-valeur détectée dans le document.

    L'image suivante montre la section Amazon Textract form extraction - Conditions for invoking human review (Extraction de formulaire Amazon Textract - Conditions d'appel d'une vérification humaine) de la console Amazon A2I. Dans l'image, les cases en regard des deux types de déclencheurs expliqués dans le paragraphe suivant sont cochées, et Mail Address est utilisé comme Nom de clé pour le premier déclencheur. Le seuil de confiance d'identification est défini à l'aide d'indices de confiance pour les paires clé-valeur détectées dans le formulaire. Il est défini entre 0 et 99. Le seuil de confiance de qualification est défini à l'aide d'indices de confiance pour le texte contenu dans les clés et les valeurs d'un formulaire. Il est défini entre 0 et 99.

    Amazon Rekognition – Image moderation

    1. Sélectionnez Trigger human review for labels identified by Amazon Rekognition based on label confidence score (Déclencher une vérification humaine pour les étiquettes identifiées par Amazon Rekognition en fonction de l'indice de confiance de l'étiquette).

    2. Définissez Threshold (Seuil) entre 0 et 98.

    Cela initie une vérification humaine si Amazon Rekognition renvoie un indice de confiance inférieur à 98 pour une tâche de modération des images.

    L'image suivante illustre la façon dont vous pouvez sélectionner l'option Trigger human review for labels identified by Amazon Rekognition based on label confidence score (Déclencher une vérification humaine pour les étiquettes identifiées par Amazon Rekognition en fonction de l'indice de confiance de l'étiquette) et saisissez un Threshold (Seuil) entre 0 et 98 dans la console Amazon A2I.

  6. Pour Worker task template creation (Création d'un modèle de tâche d'employé), sélectionnez Create from a default template (Créer à partir d'un modèle par défaut).

  7. Saisissez un Template name (Nom de modèle).

  8. Dans le champ Task description (Description de la tâche), saisissez le texte suivant :

    Read the instructions carefully and complete the task.

  9. Pour Workers (Employés), sélectionnez Privé.

  10. Sélectionnez l'équipe privée que vous avez créée.

  11. Choisissez Create (Créer).

Une fois que votre flux de vérification humaine est créé, il apparaît dans le tableau de la page Human review workflows (Flux de vérification humaine). Lorsque Status (État) est défini sur Active, copiez et enregistrez l'ARN du flux. Vous en aurez besoin à l'étape suivante.

Étape 3 : Démarrer une boucle humaine

Vous devez utiliser une opération d'API pour démarrer une boucle humaine. Vous pouvez choisir entre un grand nombre de kits SDK spécifiques au langage pour interagir avec ces opérations d'API. Pour consulter la documentation de ces différents kits SDK, reportez-vous à la section See Also (Voir aussi)dans la documentation d'API, comme illustré dans l'image suivante.

Pour ce didacticiel, vous utiliserez l'une des API suivantes :

  • Si vous avez choisi le type de tâche Amazon Textract, utilisez l'opération AnalyzeDocument.

  • Si vous avez choisi le type de tâche Amazon Rekognition, utilisez l'opération DetectModerationLabels.

Vous pouvez interagir avec ces API à l'aide d'une instance de bloc-notes SageMaker (recommandé pour les nouveaux utilisateurs) ou de l'AWS Command Line Interface (AWS CLI). Choisissez l'une des possibilités suivantes pour en savoir plus sur ces options :

Sélectionnez votre type de tâche dans le tableau suivant pour afficher des exemples de demandes pour Amazon Textract et Amazon Rekognition à l'aide de l'outil AWS SDK for Python (Boto3).

Amazon Textract – Key-value pair extraction

L'exemple suivant utilise l'outil AWS SDK for Python (Boto3) pour appeler analyze_document dans la région us-west-2. Remplacez le texte en rouge et en italique par vos ressources. N'incluez le paramètre DataAttributes que si vous utilisez la main-d'œuvre Amazon Mechanical Turk. Pour plus d'informations, veuillez consulter la documentation analyze_document dans la référence d'API AWS SDK for Python (Boto).

response = client.analyze_document( Document={ "S3Object": { "Bucket": "AWSDOC-EXAMPLE-BUCKET", "Name": "document-name.pdf" } }, HumanLoopConfig={ "FlowDefinitionArn":"arn:aws:sagemaker:us-west-2:111122223333:flow-definition/flow-definition-name", "HumanLoopName":"human-loop-name", "DataAttributes" : { "ContentClassifiers":["FreeOfPersonallyIdentifiableInformation","FreeOfAdultContent"] } }, FeatureTypes=["TABLES", "FORMS"])
Amazon Rekognition – Image moderation

L'exemple suivant utilise l'outil AWS SDK for Python (Boto3) pour appeler detect_moderation_labels dans la région us-west-2. Remplacez le texte en rouge et en italique par vos ressources. N'incluez le paramètre DataAttributes que si vous utilisez la main-d'œuvre Amazon Mechanical Turk. Pour plus d'informations, veuillez consulter la documentation detect_moderation_labels dans la référence d'API AWS SDK for Python (Boto).

response = client.detect_moderation_labels( Image={ "S3Object":{ "Bucket": "AWSDOC-EXAMPLE-BUCKET", "Name": "image-name.png" } }, HumanLoopConfig={ "FlowDefinitionArn":"arn:aws:sagemaker:us-west-2:111122223333:flow-definition/flow-definition-name", "HumanLoopName":"human-loop-name", "DataAttributes":{ ContentClassifiers:["FreeOfPersonallyIdentifiableInformation"|"FreeOfAdultContent"] } })

Étape 4 : Voir l'état de la boucle humaine dans la console

Lorsque vous démarrez une boucle humaine, vous pouvez voir son état dans la console Amazon A2I.

Pour voir l'état de votre boucle humaine

  1. Ouvrez la console Augmented AI à l'adresse https://console.aws.amazon.com/a2i pour accéder à la page Human review workflows (Flux de vérification humaine).

  2. Sélectionnez le flux de vérification humaine que vous avez utilisé pour démarrer votre boucle humaine.

  3. Dans la section Human loops (Boucles humaines), vous pouvez voir votre boucle humaine. Voir son état dans la colonne Status (État).

Étape 5 : Télécharger les données de sortie

Vos données de sortie sont stockées dans le compartiment Amazon S3 que vous avez spécifié lorsque vous avez créé un flux de vérification humaine.

Pour voir vos données de sortie Amazon A2I

  1. Ouvrez la console Amazon S3.

  2. Sélectionnez le compartiment Amazon S3 que vous avez spécifié lorsque vous avez créé votre flux de vérification humaine à l'étape 2 de cet exemple.

  3. En commençant par le dossier nommé d'après votre flux de vérification humaine, accédez à vos données de sortie en sélectionnant le dossier avec la convention de dénomination suivante :

    s3://output-bucket-specified-in-human-review-workflow/human-review-workflow-name/YYYY/MM/DD/hh/mm/ss/human-loop-name/output.json
  4. Sélectionnez output.json et choisissez Download (Télécharger).