Création d'une tâche d'étiquetage (Console) - Amazon SageMaker

Création d'une tâche d'étiquetage (Console)

Vous pouvez utiliser la console Amazon SageMaker pour créer une tâche d'étiquetage pour tous les types de tâches intégrés Ground Truth et les flux d'étiquetage personnalisés. Pour les types de tâches intégrés, nous vous recommandons d'utiliser cette page à côté de la page pour votre type de tâche. Chaque page de type de tâche contient des détails spécifiques sur la création d'une tâche d'étiquetage à l'aide de ce type de tâche.

Vous devez fournir les éléments suivants pour créer une tâche d'étiquetage dans la console SageMaker :

  • Un fichier manifeste source dans Amazon S3. Vous pouvez placer votre jeu de données source dans Amazon S3 et générer automatiquement un fichier manifeste à l'aide de la console Ground Truth (non pris en charge pour les tâches d'étiquetage de nuage de points 3D).

    Vous pouvez également créer manuellement un fichier manifeste source. Pour savoir comment procéder, veuillez consulter la section Données d'entrée.

  • Un compartiment Amazon S3 pour stocker vos données de sortie.

  • Un rôle IAM disposant de l'autorisation d'accéder à vos ressources dans Amazon S3 et avec une stratégie d'exécution SageMaker attachée. Pour une solution générale, vous pouvez attacher la stratégie gérée AmazonSageMakerFullAccess à un rôle IAM et inclure sagemaker dans le nom du compartiment.

    Pour obtenir des stratégies plus détaillées, veuillez consulter Attribuer des autorisations IAM pour utiliser Ground Truth.

    Les types de tâches de nuage de points 3D comportent des considérations de sécurité supplémentaires. En savoir plus.

  • Une équipe de travail. Vous créez une équipe de travail à partir d'une main-d'œuvre composée d'employés Amazon Mechanical Turk, de fournisseurs ou de vos propres employés privés. Pour en savoir plus, veuillez consulter Création et gestion de mains-d'œuvres.

    Vous ne pouvez pas utiliser la main-d'œuvre Mechanical Turk pour les tâches d'étiquetage de nuage de points 3D.

  • Si vous utilisez un flux d'étiquetage personnalisé, vous devez enregistrer un modèle de tâche employé dans Amazon S3 et fournir un URI Amazon S3 pour ce modèle. Pour de plus amples informations, veuillez consulter Étape 2 : Création de votre modèle de tâche employé personnalisée.

  • (Facultatif) Un ARN de clé AWS KMS, si vous souhaitez que SageMaker chiffre la sortie de votre tâche d'étiquetage à l'aide de votre propre clé de chiffrement AWS KMS au lieu de la clé de service Amazon S3 par défaut.

  • (Facultatif) Des étiquettes existantes pour l'ensemble de données que vous utilisez pour votre tâche d'étiquetage. Utilisez cette option si vous souhaitez que les collaborateurs ajustent ou approuvent et rejettent les étiquettes.

  • Si vous souhaitez créer une tâche d'ajustement ou de vérification des étiquettes, vous devez disposer d'un fichier manifeste de sortie dans Amazon S3 qui contient les étiquettes que vous souhaitez ajuster ou vérifier. Cette option n'est prise en charge que pour les tâches d'étiquetage d'image de cadre de délimitation et de segmentation sémantique et les tâches d'étiquetage de nuage de points 3D et de trames vidéo. Il est recommandé d'utiliser les instructions sur Vérifier et ajuster les étiquettes pour créer une tâche de vérification ou d'ajustement des étiquettes.

Important

Votre équipe de travail, votre fichier manifeste source, votre compartiment de sortie et les autres ressources dans Amazon S3 doivent se trouver dans la même région AWS que celle que vous utilisez pour créer votre tâche d'étiquetage.

Lorsque vous créez une tâche d'étiquetage à l'aide de la console SageMaker, vous ajoutez des instructions et des étiquettes de travail à l'interface utilisateur employé fournie par Ground Truth. Vous pouvez prévisualiser l'interface utilisateur employé et interagir avec cette dernière lorsque vous créez une tâche d'étiquetage dans la console. Vous pouvez également voir une prévisualisation de l'interface utilisateur employé sur votre page de type de tâche intégrée.

Pour créer une tâche d'étiquetage (console)

  1. Connectez-vous à la console SageMaker à l'adresse https://console.aws.amazon.com/sagemaker/.

  2. Dans le panneau de navigation de gauche, choisissez Tâches d'étiquetage.

  3. Sur la page Tâches d'étiquetage, choisissez Créer tâche d'étiquetage.

  4. Pour Nom de la tâche, entrez un nom pour votre tâche d'étiquetage.

  5. (Facultatif) Si vous souhaitez identifier vos étiquettes avec une clé, sélectionnez Je veux spécifier un nom d'attribut d'étiquette différent de celui du nom de la tâche d'étiquetage. Si vous ne sélectionnez pas cette option, le nom de la tâche d'étiquetage que vous avez spécifié à l'étape précédente sera utilisé pour identifier vos étiquettes dans votre fichier manifeste de sortie.

  6. Choisissez une configuration de données à configurer pour configurer une connexion entre votre jeu de données source et Ground Truth.

    • Pour Automated data setup (Configuration automatisée des données) :

    • Pour Manual data setup (Configuration manuelle des données) :

      • Pour Input dataset location (Emplacement du jeu de données source), indiquez l'emplacement dans Amazon S3 où se trouve votre fichier manifeste source. Par exemple, si votre fichier manifeste source manifest.json se trouve dans example-bucket, entrez s3://example-bucket/manifest.json.

      • Pour Output dataset location (Emplacement du jeu de données de sortie), indiquez l'emplacement dans Amazon S3 où vous souhaitez que Ground Truth stocke les données de sortie de votre tâche d'étiquetage.

  7. Pour IAM Role (Rôle IAM), choisissez un rôle IAM existant ou créez un rôle IAM ayant l'autorisation d'accéder à vos ressources dans Amazon S3, d'écrire dans le compartiment de sortie Amazon S3 spécifié ci-dessus et ayant une stratégie d'exécution SageMaker attachée.

  8. (Facultatif) Pour Additional configuration (Configuration supplémentaire), vous pouvez spécifier la quantité de votre jeu de données que vous souhaitez voir étiquetée par vos employés et indiquer si vous souhaitez que SageMaker chiffre les données de sortie pour votre tâche d'étiquetage à l'aide d'une clé de chiffrement AWS KMS. Pour chiffrer vos données de sortie, vous devez disposer des autorisations AWS KMS requises associées au rôle IAM que vous avez fourni à l'étape précédente. Pour en savoir plus, consultez Attribuer des autorisations IAM pour utiliser Ground Truth.

  9. Dans la section Task type (Type de tâche), sous Task category (Catégorie de tâche), utilisez le menu déroulant pour sélectionner votre catégorie de tâche.

  10. Dans Sélection de la tâche, choisissez votre type de tâche.

  11. (Facultatif) Fournissez des balises pour votre tâche d'étiquetage afin de la trouver plus facilement dans la console ultérieurement.

  12. Choisissez Suivant.

  13. Dans la section Travailleurs, choisissez le type de main-d'œuvre que vous souhaitez utiliser. Pour de plus amples informations sur les options de main-d'œuvre, veuillez consulter Création et gestion de mains-d'œuvres.

  14. Après avoir sélectionné votre main-d'œuvre, spécifiez le Délai d'exécution de la tâche. Il s'agit de la durée maximale qu'un collaborateur doit consacrer à une tâche.

    Pour les tâches d'annotation de nuage de points 3D, le délai d'exécution par défaut de la tâche est de 3 jours. Les délais d'exécution par défaut pour les tâches d'étiquetage de classification de texte et d'image, et de vérification des étiquettes, sont de 5 minutes. Les délais d'exécution par défaut pour tous les autres types de tâches d'étiquetage sont de 60 minutes.

  15. (Facultatif) Pour les types de tâches de cadre de délimitation, de segmentation sémantique et de nuage de points 3D, vous pouvez sélectionner Display existing labels (Afficher les étiquettes existantes) si vous souhaitez afficher les étiquettes de votre jeu de données source afin que les employés puissent les vérifier ou les ajuster.

    Pour les tâches d'étiquetage de cadre de délimitation et de segmentation sémantique, cela créera une tâche d'ajustement des étiquettes.

    Pour les tâches d'étiquetage de nuage de points 3D et de trame vidéo :

    • Sélectionnez des étiquettes (Ajustement) pour créer une tâche d'ajustement des étiquettes. Lorsque vous sélectionnez cette option, vous pouvez ajouter de nouvelles étiquettes, mais vous ne pouvez pas supprimer ou modifier les étiquettes existantes de la tâche précédente. Le cas échéant, vous pouvez choisir les attributs de catégorie d'étiquette et les attributs de trame que vous souhaitez voir modifier par les employés. Pour rendre un attribut modifiable, sélectionnez la case à cocher Allow workers to edit this attribute (Autoriser les employés à modifier cet attribut) pour cet attribut.

      Vous pouvez également ajouter des attributs de catégorie d'étiquette et de trame.

    • Sélectionnez Verification (Vérification) pour créer une tâche d'ajustement des étiquettes. Lorsque vous sélectionnez cette option, vous ne pouvez pas ajouter, modifier ou supprimer des étiquettes existantes dans la tâche précédente. Le cas échéant, vous pouvez choisir les attributs de catégorie d'étiquette et les attributs de trame que vous souhaitez voir modifier par les employés. Pour rendre un attribut modifiable, sélectionnez la case à cocher Allow workers to edit this attribute (Autoriser les employés à modifier cet attribut) pour cet attribut.

      Nous vous recommandons d'ajouter de nouveaux attributs de catégorie d'étiquette aux étiquettes que les employés doivent vérifier, ou d'ajouter un ou plusieurs attributs de trame pour que les employés fournissent des informations sur l'ensemble de la trame.

    Pour de plus amples informations, veuillez consulter Vérifier et ajuster les étiquettes.

  16. Configurez votre interface utilisateur employé :

    • Si vous utilisez un Type de tâche intégrée, spécifiez les instructions des employés et les étiquettes.

      • Pour la classification des images et la classification de texte (à étiquette unique et multiple), vous devez spécifier au moins deux catégories d'étiquettes. Pour tous les autres types de tâches intégrés, vous devez spécifier au moins une catégorie d'étiquette.

      • (Facultatif) Si vous créez une tâche d'étiquetage de nuage de points ou de trames vidéo 3D, vous pouvez spécifier des attributs de catégorie d'étiquette (non pris en charge pour la segmentation sémantique de nuage de points 3D) et des attributs de trame. Les attributs de catégorie d'étiquette peuvent être affectés à une ou plusieurs étiquettes. Les attributs de trame apparaîtront sur chaque étiquette de nuage de points ou de trames vidéo des employés. Pour en savoir plus, veuillez consulter Interface utilisateur (UI) de travail pour les nuages de points 3D et Interface utilisateur (UI) de travail pour les trames vidéo.

      • (Facultatif) Ajoutez Additional instructions (Instructions supplémentaires) pour aider votre employé à accomplir votre tâche.

    • Si vous créez un flux d'étiquetage personnalisé, vous devez :

      • Saisir un modèle personnalisé dans la zone de code. Les modèles personnalisés peuvent être créés à l'aide d'une combinaison de HTML, du langage de modélisation Liquid et de nos composants Web prédéfinis. Vous pouvez également choisir un modèle de base dans le menu déroulant pour commencer.

      • Spécifiez les fonctions Lambda de pré-annotation et de post-annotation. Pour savoir comment créer ces fonctionnalités , veuillez consulter Étape 3 : Traitement avec AWS Lambda.

  17. Vous pouvez sélectionner See preview (Voir la prévisualisation) pour prévisualiser vos instructions de travail et les étiquettes, et interagir avec l'interface utilisateur employé. Assurez-vous que le bloqueur de fenêtres contextuelles du navigateur est désactivé avant de générer l'aperçu.

  18. Choisissez Create (Créer).

Une fois que vous avez créé votre tâche d'étiquetage avec succès, vous êtes redirigé vers la page Tâches d'étiquetage . Le statut de la tâche d'étiquetage que vous venez de créer est In progress (En cours). Ce statut est mis à jour au fur et à mesure que les collaborateurs terminent les tâches. Lorsque toutes les tâches sont terminées avec succès, le statut devient Terminé.

Si un problème s'est produit lors de la création de la tâche d'étiquetage, son statut passe à Failed (Échec).

Pour afficher plus de détails sur la tâche, choisissez le nom de la tâche d'étiquetage.

Étapes suivantes

Une fois que le statut de votre tâche d'étiquetage passe à Completed (Terminé), vous pouvez afficher vos données de sortie dans le compartiment Amazon S3 que vous avez spécifié lors de la création de cette tâche d'étiquetage. Pour de plus amples informations sur le format de vos données de sortie, veuillez consulter Données de sortie.