Étiquettes au niveau de l’image dans les fichiers manifestes - Rekognition

Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.

Étiquettes au niveau de l’image dans les fichiers manifestes

Pour importer des étiquettes au niveau de l'image (images étiquetées avec des scènes, des concepts ou des objets ne nécessitant pas d'informations de localisation), vous ajoutez des lignes JSON au format SageMaker Ground Truth Classification Job Output à un fichier manifeste. Un fichier manifeste est composé d’une ou de plusieurs lignes JSON, une pour chaque image que vous souhaitez importer.

Astuce

Pour simplifier la création d’un fichier manifeste, nous fournissons un script Python qui crée un fichier manifeste à partir d’un fichier CSV. Pour plus d’informations, consultez Création d’un fichier manifeste à partir d’un fichier CSV.

Pour créer un fichier manifeste pour des étiquettes au niveau de l’image
  1. Créez un fichier texte vide.

  2. Ajoutez une ligne JSON pour chaque image que vous souhaitez importer. Chaque ligne JSON doit ressembler à ce qui suit.

    {"source-ref":"s3://custom-labels-console-us-east-1-nnnnnnnnnn/gt-job/manifest/IMG_1133.png","TestCLConsoleBucket":0,"TestCLConsoleBucket-metadata":{"confidence":0.95,"job-name":"labeling-job/testclconsolebucket","class-name":"Echo Dot","human-annotated":"yes","creation-date":"2020-04-15T20:17:23.433061","type":"groundtruth/image-classification"}}
  3. Enregistrez le fichier. Vous pouvez utiliser l’extension .manifest, mais cela n’est pas obligatoire.

  4. Créez un jeu de données à l’aide du fichier manifeste que vous avez créé. Pour plus d’informations, consultez Pour créer un ensemble de données à l'aide d'un fichier manifeste au format SageMaker Ground Truth (console).

Lignes JSON au niveau de l’image

Dans cette section, nous vous expliquons comment créer une ligne JSON pour une image unique. Examinez l’image suivante. Une scène pour l’image suivante pourrait s’appeler Sunrise.

Coucher de soleil sur un lac avec un quai et de petits bateaux, entouré de montagnes.

La ligne JSON de l’image précédente, avec la scène Sunrise, pourrait être la suivante.

{ "source-ref": "s3://bucket/images/sunrise.png", "testdataset-classification_Sunrise": 1, "testdataset-classification_Sunrise-metadata": { "confidence": 1, "job-name": "labeling-job/testdataset-classification_Sunrise", "class-name": "Sunrise", "human-annotated": "yes", "creation-date": "2020-03-06T17:46:39.176", "type": "groundtruth/image-classification" } }

Notez les informations suivantes.

source-ref

(Obligatoire) Emplacement Amazon S3 de l’image. Le format est "s3://BUCKET/OBJECT_PATH". Les images d’un jeu de données importé doivent être stockées dans le même compartiment Amazon S3.

testdataset-classification_Sunrise

(Obligatoire) Attribut de l’étiquette. Vous choisissez le nom du champ. La valeur du champ (1 dans l’exemple précédent) est un identifiant d’attribut d’étiquette. Elle n’est pas utilisée par Étiquettes personnalisées Amazon Rekognition et peut être n’importe quelle valeur entière. Les métadonnées correspondantes doivent être identifiées par le nom du champ, nom auquel vous devez ajouter -metadata. Par exemple, "testdataset-classification_Sunrise-metadata".

testdataset-classification_Sunrise-metadata

(Obligatoire) Métadonnées relatives à l’attribut de l’étiquette. Le nom du champ doit être identique à celui de l’attribut de l’étiquette. La mention -metadata doit être ajoutée à la fin du nom.

confidence

(Obligatoire) Pas utilisé actuellement par Étiquettes personnalisées Amazon Rekognition, mais une valeur comprise entre 0 et 1 doit être fournie.

job-name

(Facultatif) Nom que vous choisissez pour la tâche qui traitera l’image.

class-name

(Obligatoire) Nom de classe que vous choisissez pour la scène ou le concept qui s’applique à l’image. Par exemple, "Sunrise".

human-annotated

(Obligatoire) Spécifiez "yes" si l’annotation a été complétée par un humain. Sinon, spécifiez "no".

creation-date

(Obligatoire) Date et heure UTC (Coordinated Universal Time) de création de l’étiquette.

type

(Obligatoire) Type de traitement à appliquer à l’image. Pour les étiquettes au niveau de l’image, la valeur est "groundtruth/image-classification".

Ajout de plusieurs étiquettes au niveau de l’image à une image

Vous pouvez ajouter plusieurs étiquettes à une image. Par exemple, le code JSON suivant ajoute deux étiquettes, football et ball, à une seule image.

{ "source-ref": "S3 bucket location", "sport0":0, # FIRST label "sport0-metadata": { "class-name": "football", "confidence": 0.8, "type":"groundtruth/image-classification", "job-name": "identify-sport", "human-annotated": "yes", "creation-date": "2018-10-18T22:18:13.527256" }, "sport1":1, # SECOND label "sport1-metadata": { "class-name": "ball", "confidence": 0.8, "type":"groundtruth/image-classification", "job-name": "identify-sport", "human-annotated": "yes", "creation-date": "2018-10-18T22:18:13.527256" } } # end of annotations for 1 image