Vérifier et ajuster les étiquettes - Amazon SageMaker

Vérifier et ajuster les étiquettes

Lorsque les étiquettes d'un jeu de données doivent être validées, Amazon SageMaker Ground Truth fournit une fonctionnalité permettant aux employés de vérifier que les étiquettes sont correctes ou d'ajuster les étiquettes précédentes.

Ces types de tâches se répartissent en deux catégories distinctes :

  • Vérification des étiquettes – Les employés indiquent si les étiquettes existantes sont correctes ou évaluent leur qualité, et peuvent ajouter des commentaires pour expliquer leur raisonnement. Les employés ne seront pas en mesure de modifier ou d'ajuster les étiquettes.

    Si vous créez une tâche d'ajustement ou de vérification de l'étiquette de nuage de points 3D ou d'image vidéo, vous pouvez choisir de rendre les attributs de catégorie d'étiquette (non pris en charge pour la segmentation sémantique de nuage de points 3D) et les attributs d'image modifiables par les employés.

  • Ajustement des étiquettes – Les employés ajustent les annotations antérieures et, le cas échéant, les attributs de catégorie d'étiquette et de trame pour les corriger.

Les types de tâches intégrées Ground Truth suivants prennent en charge les tâches d'ajustement et de vérification des étiquettes :

  • Cadre de délimitation

  • Segmentation sémantique

  • Détection d'objets de nuage de points 3D, suivi d'objets de nuage de points 3D et segmentation sémantique de nuage de points 3D

  • Tous les types de tâches de détection d'objets dans les trames vidéo et de suivi d'objets dans les trames vidéo : cadre de délimitation, polyligne, polygone et point clé

Astuce

Pour les tâches de vérification d'étiquetage de nuage de points 3D et de trame vidéo, il est recommandé d'ajouter de nouveaux attributs de catégorie d'étiquette ou de trame à la tâche d'étiquetage. Les employés peuvent utiliser ces attributs pour vérifier les étiquettes individuelles ou l'ensemble de la trame. Pour en savoir plus sur les attributs de catégorie d'étiquette et de trame, veuillez consulter Interface utilisateur (UI) de travail pour les nuages de points 3D et Interface utilisateur (UI) de travail pour les trames vidéo.

Vous pouvez démarrer des tâches d'ajustement et de vérification des étiquettes à l'aide de la console SageMaker ou de l'API.

Exigences relatives à la création de tâches de vérification et d'ajustement des étiquettes

Pour créer une tâche de vérification ou d'ajustement des étiquettes, les critères suivants doivent être satisfaits.

  • Pour les tâches d'étiquetage ponctuelles (qui ne s'exécutent pas en streaming) : le fichier manifeste source que vous utilisez doit contenir le nom d'attribut d'étiquette (LabelAttributeName) des étiquettes que vous souhaitez ajuster. Lorsque vous chaînez des tâches, le fichier manifeste de sortie d'une tâche d'étiquetage terminée avec succès est utilisé comme fichier manifeste source pour la nouvelle tâche chaînée. Pour en savoir plus sur le format du fichier manifeste de sortie produit par Ground Truth pour chaque type de tâche, veuillez consulter Données de sortie.

    Pour les tâches d'étiquetage en streaming : le message Amazon SNS que vous avez envoyé à la rubrique d'entrée Amazon SNS de la tâche d'étiquetage d'ajustement ou de vérification doit contenir le nom d'attribut d'étiquette des étiquettes que vous souhaitez ajuster ou vérifier. Pour voir un exemple de la façon dont vous pouvez créer une tâche d'ajustement ou de vérification des étiquettes avec des tâches d'étiquetage en streaming, veuillez consulter cet Exemple de bloc-notes Jupyter dans GitHub.

  • Le type de tâche de la tâche de vérification ou d'ajustement des étiquettes doit être le même que le type de tâche de la tâche d'origine, sauf si vous utilisez la commande Vérification des étiquettes d'image pour vérifier des étiquettes d'image de cadre de délimitation ou de segmentation sémantique. Reportez-vous à la puce suivante pour plus de détails sur les exigences relatives au type de tâche de trame vidéo.

  • Pour les tâches de vérification et d'ajustement des annotations de trame vidéo, vous devez utiliser le même type de tâche d'annotation que celui utilisé pour créer les annotations à partir de la tâche d'étiquetage précédente. Par exemple, si vous créez une tâche de détection d'objets dans les trames vidéo pour que les employés dessinent des cadres de délimitation autour d'objets, puis que vous créez une tâche d'ajustement de détection d'objets vidéo, vous devez spécifier Cadres de délimitation comme type de tâche d'annotation. Pour en savoir plus sur les types de tâches d'annotation de trame vidéo, veuillez consulter Types de tâche.

  • Le type de tâche que vous sélectionnez pour une tâche d'ajustement ou de vérification des étiquettes doit prendre en charge un flux de travail d'audit. Les types de tâche intégrés Ground Truth intégrés suivants prennent en charge les travaux d'ajustement et d'étiquetage de vérification : cadre de délimitation, segmentation sémantique, détection d'objets dans un nuage de points en 3D, suivi d'objets dans un nuage de points en 3D et segmentation sémantique dans un nuage de points en 3D, ainsi que tous les types de tâches de détection d'objets dans une trame vidéo et de suivi d'objets dans une trame vidéo — cadre de délimitation, polyligne, polygone et point clé.

Créer une tâche de vérification des étiquettes (Console)

Les tâches d'étiquetage de cadre de délimitation et de segmentation sémantique sont créées en choisissant le type de tâche Vérification des étiquettes dans la console. Pour créer une tâche de vérification pour les types de tâches nuage de points 3D et trame vidéo, vous devez choisir le même type de tâche que la tâche d'étiquetage originale et choisir d'afficher les étiquettes existantes. Utilisez l'une des sections suivantes pour créer une tâche de vérification des étiquettes pour votre type de tâche.

Créer une tâche de vérification des étiquettes d'images (Console)

Utilisez la procédure suivante pour créer une tâche de vérification de cadre de délimitation ou de segmentation sémantique à l'aide de la console. Cette procédure suppose que vous avez déjà créé une tâche d'étiquetage de cadre de délimitation ou de segmentation sémantique et que son état est Terminé. Il s'agit de la tâche d'étiquetage qui produit les étiquettes que vous souhaitez vérifier.

Pour créer une tâche de vérification d'étiquette d'image :

  1. Ouvrez la console SageMaker à l'adresse https://console.aws.amazon.com/sagemaker/ et choisissez Labeling jobs (Tâches d'étiquetage).

  2. Démarrez une nouvelle tâche d'étiquetage en chaînant une tâche précédente ou en partant de zéro en spécifiant un manifeste d'entrée contenant des objets de données étiquetés.

  3. Dans le volet Task type (Type de tâche), sélectionnez Label verification (Vérification des étiquettes).

  4. Choisissez Suivant.

  5. Dans la section Travailleurs, choisissez le type de main-d'œuvre que vous souhaitez utiliser. Pour de plus amples informations sur les options de main-d'œuvre, veuillez consulter Création et gestion de mains-d'œuvres.

  6. (Facultatif) Après avoir sélectionné votre main-d'œuvre, spécifiez le Task timeout (Délai d'exécution de la tâche) et le Task expiration time (Délai d'expiration de la tâche).

  7. Dans le volet Display existing labels options (Options d'affichage des étiquettes existantes), le système affiche les noms d'attributs d'étiquettes disponibles dans votre manifeste. Choisissez le nom de l'attribut d'étiquette pour la tâche d'étiquetage que vous souhaitez vérifier. Ground Truth essaie de détecter et de remplir ces valeurs en analysant le manifeste, mais il se peut que vous deviez définir la valeur correcte.

  8. Utilisez les sections d'instructions du concepteur d'outils pour fournir un contexte sur ce que les anciens étiqueteurs ont été invités à faire et ce que les vérificateurs actuels doivent vérifier.

    Vous pouvez ajouter de nouvelles étiquettes parmi lesquelles les employés choisissent pour vérifier les étiquettes. Par exemple, vous pouvez demander aux employés de vérifier la qualité de l'image et fournir les étiquettes Nette et Floue. Les employés auront également la possibilité d'ajouter un commentaire pour expliquer leur sélection.

  9. Utilisez l'option See preview (Voir aperçu) pour vérifier que l'outil affiche correctement les étiquettes précédentes et présente clairement la tâche de vérification d'étiquettes.

  10. Sélectionnez Create (Créer). Cela créera et commencera votre travail d'étiquetage.

Créer une tâche de vérification de l'étiquetage d'un nuage de points ou d'une trame vidéo (Console)

Utilisez la procédure suivante pour créer une tâche de vérification de trame vidéo ou de nuage de points 3D à l'aide de la console. Cette procédure suppose que vous avez déjà créé une tâche d'étiquetage à l'aide du type de tâche qui produit les types d'étiquettes que vous souhaitez vérifier et dont le statut est Terminé.

Pour créer une tâche de vérification d'étiquette d'image :

  1. Ouvrez la console SageMaker à l'adresse https://console.aws.amazon.com/sagemaker/ et choisissez Labeling jobs (Tâches d'étiquetage).

  2. Démarrez une nouvelle tâche d'étiquetage en chaînant une tâche précédente ou en partant de zéro en spécifiant un manifeste d'entrée contenant des objets de données étiquetés.

  3. Dans le volet Task type (Type de tâche), sélectionnez le même type de tâche que la tâche d'étiquetage que vous avez chaîné. Par exemple, si la tâche d'étiquetage d'origine était une tâche d'étiquetage par point clé de détection d'objet dans une trame vidéo, sélectionnez ce type de tâche.

  4. Choisissez Suivant.

  5. Dans la section Travailleurs, choisissez le type de main-d'œuvre que vous souhaitez utiliser. Pour de plus amples informations sur les options de main-d'œuvre, veuillez consulter Création et gestion de mains-d'œuvres.

  6. (Facultatif) Après avoir sélectionné votre main-d'œuvre, spécifiez le Task timeout (Délai d'exécution de la tâche) et le Task expiration time (Délai d'expiration de la tâche).

  7. Activez le sélecteur à côté de Display existing labels (Afficher les étiquettes existantes).

  8. Sélectionnez Verification (Vérification).

  9. Pour Label attribute name (Nom de l'attribut d'étiquette) choisissez le nom dans votre manifeste qui correspond aux étiquettes que vous souhaitez afficher pour vérification. Vous ne verrez que les noms des attributs des étiquettes qui correspondent au type de tâche que vous avez sélectionné dans l'écran précédent. Ground Truth essaie de détecter et de remplir ces valeurs en analysant le manifeste, mais il se peut que vous deviez définir la valeur correcte.

  10. Utilisez les sections d'instructions du concepteur d'outils pour fournir un contexte sur ce que les anciens étiqueteurs ont été invités à faire et ce que les vérificateurs actuels doivent vérifier.

    Vous ne pouvez pas modifier ni ajouter de nouvelles étiquettes. Vous pouvez supprimer, modifier et ajouter de nouveaux attributs de catégorie d'étiquette ou de trame. Il est recommandé d'ajouter de nouveaux attributs de catégorie d'étiquette ou d'attributs de trame à la tâche d'étiquetage. Les employés peuvent utiliser ces attributs pour vérifier les étiquettes individuelles ou l'ensemble de la trame.

    Par défaut, les attributs de catégorie d'étiquette préexistants et les attributs de trame ne seront pas modifiables par les employés. Si vous souhaitez modifier une catégorie d'étiquette ou un attribut de trame, sélectionnez la case à cocher Allow workers to edit this attribute (Autoriser les employés à modifier cet attribut) pour cet attribut.

    Pour en savoir plus sur les attributs de catégorie d'étiquette et de trame, veuillez consulter Interface utilisateur (UI) de travail pour les nuages de points 3D et Interface utilisateur (UI) de travail pour les trames vidéo.

  11. Utilisez l'option See preview (Voir aperçu) pour vérifier que l'outil affiche correctement les étiquettes précédentes et présente clairement la tâche de vérification d'étiquettes.

  12. Sélectionnez Create (Créer). Cela créera et commencera votre travail d'étiquetage.

Créer une tâche d'ajustement des étiquettes (Console)

Utilisez l'une des sections suivantes pour créer une tâche de vérification des étiquettes pour votre type de tâche.

Créer une tâche d'ajustement des étiquettes d'image (Console)

Utilisez la procédure suivante pour créer une tâche d'ajustement des étiquettes de cadre de délimitation ou de segmentation sémantique à l'aide de la console. Cette procédure suppose que vous avez déjà créé une tâche d'étiquetage de cadre de délimitation ou de segmentation sémantique et que son état est Terminé. Il s'agit de la tâche d'étiquetage qui produit les étiquettes que vous souhaitez ajuster.

Pour créer une tâche d'ajustement des étiquettes d'image (Console)

  1. Ouvrez la console SageMaker à l'adresse https://console.aws.amazon.com/sagemaker/ et choisissez Labeling jobs (Tâches d'étiquetage).

  2. Démarrez une nouvelle tâche d'étiquetage en chaînant une tâche précédente ou en partant de zéro en spécifiant un manifeste d'entrée contenant des objets de données étiquetés.

  3. Choisissez le même type de tâche que la tâche d'étiquetage d'origine.

  4. Choisissez Suivant.

  5. Dans la section Travailleurs, choisissez le type de main-d'œuvre que vous souhaitez utiliser. Pour de plus amples informations sur les options de main-d'œuvre, veuillez consulter Création et gestion de mains-d'œuvres.

  6. (Facultatif) Après avoir sélectionné votre main-d'œuvre, spécifiez le Task timeout (Délai d'exécution de la tâche) et le Task expiration time (Délai d'expiration de la tâche).

  7. Développez Existing-labels display options (Options d'affichage des étiquettes existantes) en sélectionnant la flèche en regard du titre.

  8. Cochez la case en regard de I want to display existing labels from the dataset for this job (Je veux afficher les étiquettes existantes du jeu de données pour cette tâche).

  9. Pour Label attribute name (Nom de l'attribut d'étiquette), choisissez le nom dans votre manifeste qui correspond aux étiquettes que vous souhaitez afficher pour ajustement. Vous ne verrez que les noms des attributs des étiquettes qui correspondent au type de tâche que vous avez sélectionné dans l'écran précédent. Ground Truth essaie de détecter et de remplir ces valeurs en analysant le manifeste, mais il se peut que vous deviez définir la valeur correcte.

  10. Utilisez les sections d'instructions du concepteur d'outils pour fournir un contexte sur ce que les anciens étiqueteurs ont été chargés de faire et ce que les vérificateurs actuels ont besoin de vérifier et d'ajuster.

  11. Choisissez Voir l'aperçu pour vérifier que l'outil affiche correctement les étiquettes précédentes et affiche clairement la tâche.

  12. Sélectionnez Create (Créer). Cela créera et commencera votre travail d'étiquetage.

Créer une tâche d'ajustement des étiquettes de nuage de points ou de trame vidéo (Console)

Utilisez la procédure suivante pour créer une tâche d'ajustement de trames vidéo ou de nuage de points 3D à l'aide de la console. Cette procédure suppose que vous avez déjà créé une tâche d'étiquetage à l'aide du type de tâche qui produit les types d'étiquettes que vous souhaitez vérifier et dont le statut est Terminé.

Pour créer une tâche d'ajustement des étiquettes de nuages de points 3D ou de trames vidéo (console)

  1. Ouvrez la console SageMaker : https://console.aws.amazon.com/sagemaker/, puis choisissez Labeling jobs (Tâches d'étiquetage).

  2. Démarrez une nouvelle tâche d'étiquetage en chaînant une tâche précédente ou en partant de zéro en spécifiant un manifeste d'entrée contenant des objets de données étiquetés.

  3. Choisissez le même type de tâche que la tâche d'étiquetage d'origine.

  4. Activez le sélecteur à côté de Display existing labels (Afficher les étiquettes existantes).

  5. Sélectionnez Adjustment (Ajustement).

  6. Pour Label attribute name (Nom de l'attribut d'étiquette), choisissez le nom dans votre manifeste qui correspond aux étiquettes que vous souhaitez afficher pour ajustement. Vous ne verrez que les noms des attributs des étiquettes qui correspondent au type de tâche que vous avez sélectionné dans l'écran précédent. Ground Truth essaie de détecter et de remplir ces valeurs en analysant le manifeste, mais il se peut que vous deviez définir la valeur correcte.

  7. Utilisez les zones d'instructions du concepteur de l'outil pour fournir un contexte sur ce que les étiqueteurs précédents devaient faire et ce que les ajusteurs actuels doivent vérifier.

    Vous ne pouvez pas supprimer ou modifier des étiquettes existantes, mais vous pouvez ajouter de nouvelles étiquettes. Vous pouvez supprimer, modifier et ajouter de nouveaux attributs de catégorie d'étiquette ou de trame.

    Par défaut, les attributs de catégorie d'étiquette préexistants et les attributs de cadre seront modifiables par les employés. Si vous voulez rendre une catégorie d'étiquette ou un attribut de trame non modifiable, désélectionnez la case à cocher Allow workers to edit this attribute (Autoriser les collaborateurs à modifier cet attribut) pour cet attribut.

    Pour en savoir plus sur les attributs de catégorie d'étiquette et de trame, veuillez consulter Interface utilisateur (UI) de travail pour les nuages de points 3D et Interface utilisateur (UI) de travail pour les trames vidéo.

  8. Choisissez Voir l'aperçu pour vérifier que l'outil affiche correctement les étiquettes précédentes et affiche clairement la tâche.

  9. Sélectionnez Create (Créer). Cela créera et commencera votre travail d'étiquetage.

Démarrer une tâche de vérification ou d'ajustement des étiquettes (API)

Démarrez un travail de vérification ou d'ajustement d'étiquette en chaînant un travail terminé avec succès ou en démarrant un nouveau travail à partir de zéro à l'aide de l'opération CreateLabelingJob. La procédure est presque identique à la mise en place d'une nouvelle tâche d'étiquetage en utilisant CreateLabelingJob, avec quelques modifications. Utilisez les sections suivantes pour apprendre quelles modifications sont requises pour chaîner une tâche d'étiquetage afin de créer une tâche d'ajustement ou de vérification des étiquettes.

Lorsque vous créez une tâche d'ajustement ou de vérification des étiquettes à l'aide de l'API Ground Truth, vous devez utiliser un LabelAttributeName différent de celui de la tâche d'étiquetage d'origine. La tâche d'étiquetage originale est celle qui a été utilisée pour créer les étiquettes que vous voulez ajuster ou vérifier.

Important

Le fichier de configuration de la catégorie d'étiquettes que vous identifiez pour un travail d'ajustement ou de vérification dans LabelCategoryConfigS3Uri de CreateLabelingJob doit contenir les mêmes étiquettes que celles utilisées dans la tâche d'étiquetage originale. Vous pouvez ajouter de nouvelles étiquettes. Pour les tâches de nuage de points et de trames vidéo 3D, vous pouvez ajouter de nouveaux attributs de catégorie d'étiquette et d'image au fichier de configuration de catégorie d'étiquette.

Zone de délimitation et segmentation sémantique

Pour créer une tâche de vérification ou d'ajustement d'étiquettes de cadre de délimitation ou de segmentation sémantique, utilisez les directives suivantes pour spécifier les attributs de l'API pour l'opération CreateLabelingJob.

  • Utilisez le paramètre LabelAttributeName afin de spécifier le nom d'étiquette en sortie que vous souhaitez utiliser pour les étiquettes vérifiées ou ajustées. Vous devez utiliser un LabelAttributeName différent de celui utilisé pour la tâche d'étiquetage d'origine.

  • Si vous enchaînez le travail, les étiquettes de la tâche d'étiquetage précédente à ajuster ou à vérifier seront spécifiées dans le modèle d'interface utilisateur personnalisé. Pour savoir comment créer un modèle personnalisé, veuillez consulter Créer des modèles de tâches d'employé personnalisés.

    Identifiez l'emplacement du modèle d'interface utilisateur dans le paramètre UiTemplateS3Uri. SageMaker fournit des widgets que vous pouvez utiliser dans votre modèle personnalisé pour afficher les anciennes étiquettes. Utilisez l'attribut initial-value de l'un des éléments de foule suivants pour extraire les étiquettes qui nécessitent une vérification ou un ajustement et les inclure dans votre modèle de tâche :

    • crowd-semantic-segmentation — Utilisez cet élément de foule dans votre modèle de tâche d'interface utilisateur personnalisée pour spécifier des étiquettes de segmentation sémantique qui doivent être vérifiées ou ajustées.

    • crowd-bounding-box — Utilisez cet élément de foule dans votre modèle de tâche d'interface utilisateur personnalisée pour spécifier les étiquettes de cadre de délimitation qui doivent être vérifiées ou ajustées.

  • Le paramètre LabelCategoryConfigS3Uri doit contenir les mêmes catégories d'étiquettes que la tâche d'étiquetage précédente.

  • Utilisez les ARN Lambda de vérification ou d'ajustement de cadre de délimitation ou de segmentation sémantique pour PreHumanTaskLambdaArn et AnnotationConsolidationLambdaArn :

    • Pour le cadre de délimitation, les ARN de fonction Lambda de la tâche d'ajustement des étiquettes se terminent par AdjustmentBoundingBox et les ARN de fonction Lambda de vérification se terminent par VerificationBoundingBox.

    • Pour la segmentation sémantique, les ARN de fonction Lambda de la tâche d'ajustement des étiquettes se terminent par AdjustmentSemanticSegmentation et les ARN de fonction Lambda de vérification se terminent par VerificationSemanticSegmentation.

Nuage de points 3D et trame vidéo

  • Utilisez le paramètre LabelAttributeName afin de spécifier le nom d'étiquette en sortie que vous souhaitez utiliser pour les étiquettes vérifiées ou ajustées. Vous devez utiliser un LabelAttributeName différent de celui utilisé pour la tâche d'étiquetage d'origine.

  • Vous devez utiliser l'interface utilisateur de tâche humaine Amazon Resource Name (ARN) (HumanTaskUiArn) utilisé pour la tâche d'étiquetage d'origine. Pour voir les ARN pris en charge, veuillez consulter HumanTaskUiArn.

  • Dans le fichier de configuration de catégorie d'étiquette, vous devez spécifier le nom d'attribut d'étiquette (LabelAttributeName) de la tâche d'étiquetage précédente, que vous avez utilisé pour créer la tâche d'étiquetage d'ajustement ou de vérification dans le paramètre auditLabelAttributeName.

  • Vous spécifiez si votre tâche d'étiquetage est une tâche de vérification ou d'ajustement des étiquettes en utilisant le paramètre editsAllowed dans votre fichier de configuration de catégorie d'étiquette, identifié par le paramètre LabelCategoryConfigS3Uri.

    • Pour les tâches de vérification des étiquettes, vous devez utiliser le paramètre editsAllowed pour spécifier que toutes les étiquettes ne peuvent pas être modifiées. editsAllowed doit être défini sur "none" dans chaque entrée de labels. Le cas échéant, vous pouvez spécifier si les attributs des catégories d'étiquettes et des attributs de trame peuvent être ajustés par les employés.

    • Facultativement, pour ajustement, vous pouvez utiliser le paramètre editsAllowed pour spécifier des étiquettes, des attributs de catégorie d'étiquette et des attributs de trame qui peuvent ou ne peuvent pas être modifiés par les employés. Si vous n'utilisez pas ce paramètre, toutes les étiquettes, les attributs de catégorie d'étiquette et les attributs de trame seront modifiables.

    Pour en savoir plus sur le paramètre editsAllowed et la conception de votre fichier de configuration de catégorie d'étiquette, veuillez consulter Schéma du fichier de configuration de catégorie d'étiquette.

  • Utilisez les ARN Lambda d'ajustement de nuage de points 3D ou de trame vidéo pour PreHumanTaskLambdaArn et AnnotationConsolidationLambdaArn pour les tâches d'ajustement et de vérification des étiquettes :

    • Pour les nuages de points 3D, les ARN de la fonction Lambda de tâche d'ajustement et de vérification d'étiquettes se terminent par Adjustment3DPointCloudSemanticSegmentation, Adjustment3DPointCloudObjectTracking et Adjustment3DPointCloudObjectDetection, respectivement pour la segmentation sémantique de nuage de points 3D, la détection d'objets et le suivi d'objets.

    • Pour les trames vidéo, les ARN de la fonction Lambda de tâche d'ajustement et de vérification d'étiquettes se termine par AdjustmentVideoObjectDetection et AdjustmentVideoObjectTracking, respectivement pour la détection d'objets et le suivi d'objets dans les trames vidéo.

Ground Truth stocke les données de sortie d'une tâche de vérification ou d'ajustement des étiquettes dans le compartiment S3 que vous avez spécifié dans le paramètre S3OutputPath de l'opération CreateLabelingJob. Pour plus d'informations sur les données en sortie d'un travail d'étiquetage de vérification ou d'ajustement, reportez-vous à la section Données de vérification et d'ajustement des étiquettes dans le manifeste de sortie.

Données de vérification et d'ajustement des étiquettes dans le manifeste de sortie

Amazon SageMaker Ground Truth écrit les données de vérification des étiquettes dans le manifeste de sortie, dans les métadonnées de l'étiquette. Il ajoute deux propriétés aux métadonnées :

  • Une propriété type avec la valeur groundtruth/label-verification.

  • Propriété worker-feedback avec un tableau de valeurs comment. Cette propriété est ajoutée lorsque le travailleur saisit des commentaires. S'il n'y a pas de commentaires, le champ n'apparaît pas.

L'exemple de manifeste de sortie suivant montre comment les données de vérification des étiquettes apparaissent :

{ "source-ref":"S3 bucket location", "verify-bounding-box":"1", "verify-bounding-box-metadata": { "class-name": "bad", "confidence": 0.93, "type": "groundtruth/label-verification", "job-name": "verify-bounding-boxes", "human-annotated": "yes", "creation-date": "2018-10-18T22:18:13.527256", "worker-feedback": [ {"comment": "The bounding box on the bird is too wide on the right side."}, {"comment": "The bird on the upper right is not labeled."} ] } }

Dans les tâches d'ajustement, la sortie du travail ressemble à la sortie du travail de la tâche d'origine, sauf qu'elle contiendra les valeurs ajustées et une propriété adjustment-status avec la valeur adjusted ou unadjusted pour indiquer si un ajustement a été effectué.

Voir la page pour plus d'exemples de la sortie de différentes tâches Données de sortie.

Mises en garde et considérations

Pour obtenir le comportement attendu lors de la création d'un travail de vérification ou d'ajustement d'étiquette, vérifiez soigneusement vos données d'entrée.

  • Si vous utilisez des données d'image, vérifiez que votre fichier manifeste contient des informations de couleur RVB hexadécimales.

  • Pour économiser de l'argent sur les coûts de traitement, filtrez vos données pour vous assurer que vous n'incluez pas d'objets indésirables dans votre manifeste d'entrée de travail d'étiquetage.

  • Ajoutez les autorisations Amazon S3 requises pour garantir le traitement correct de vos données source.

Lorsque vous créez une tâche d'ajustement ou de vérification des étiquettes à l'aide de l'API Ground Truth, vous devez utiliser un LabelAttributeName différent de celui de la tâche d'étiquetage d'origine.

Informations sur les couleurs requises pour les travaux de segmentation sémantique

Pour reproduire correctement les informations de couleur dans les tâches de vérification ou de réglage, l'outil nécessite des informations de couleur RVB hexadécimales dans le manifeste (par exemple #FFFFFF pour le blanc). Lors de la configuration d'un travail de vérification ou d'ajustement de segmentation sémantique, l'outil examine le manifeste pour déterminer si cette information est présente. S'il ne le trouve pas, Amazon SageMaker Ground Truth affiche un message d'erreur et la configuration de la tâche se termine.

Dans les itérations précédentes de l'outil Segmentation sémantique, les informations de couleur de catégorie n'étaient pas affichées au format RVB hexadécimal dans le manifeste de sortie. Cette fonctionnalité a été introduite dans le manifeste de sortie en même temps que les flux de vérification et d'ajustement ont été introduits. Par conséquent, les anciens manifestes de sortie ne sont pas compatibles avec ce nouveau flux de travail.

Filtrage de vos données avant de démarrer la tâche

Amazon SageMaker Ground Truth traite tous les objets de votre manifeste source. Si vous avez un jeu de données partiellement étiqueté, vous pouvez créer un manifeste personnalisé à l'aide d'une requête Amazon S3 Select sur votre manifeste source. Les objets non étiquetés échouent individuellement, mais ils n'entraînent pas l'échec de la tâche et peuvent entraîner des coûts de traitement. Le filtrage des objets que vous ne souhaitez pas vérifier réduit vos coûts.

Si vous créez une tâche de vérification à l'aide de la console, vous pouvez utiliser les outils de filtrage qui y sont fournis. Si vous créez des tâches à l'aide de l'API, faites du filtrage de vos données une partie de votre flux de travail si nécessaire.