Utilisation des jeux de données - Rekognition

Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.

Utilisation des jeux de données

La façon dont vous étiquetez les jeux de données d’entraînement et de test de votre projet détermine le type de modèle que vous créez. Avec Étiquettes personnalisées Amazon Rekognition, vous pouvez créer des modèles présentant les caractéristiques suivantes.

Recherche d’objets, de scènes et de concepts

Le modèle classe les objets, les scènes et les concepts associés à une image complète.

Vous pouvez créer deux types de modèles de classification : la classification d’images et la classification à plusieurs étiquettes. Pour les deux types de modèles de classification, le modèle trouve une ou plusieurs étiquettes correspondantes parmi l’ensemble complet d’étiquettes utilisées pour l’entraînement. Les jeux de données d’entraînement et de test nécessitent tous au moins deux étiquettes.

Classification d’images

Le modèle classe les images comme appartenant à un ensemble d’étiquettes prédéfinies. Supposons, par exemple, que vous ayez besoin d’un modèle qui détermine si une image contient un espace de vie. L’image suivante peut avoir une étiquette living_space au niveau de l’image.

Salon confortable avec foyer, grandes fenêtres donnant sur le patio arrière. Tons neutres, accents en bois.

Pour ce type de modèle, ajoutez une seule étiquette au niveau de l’image à chacune des images des jeux de données d’entraînement et de test. Pour un exemple de projet, consultez Classification d’images.

Classification à plusieurs étiquettes

Le modèle classe les images dans plusieurs catégories, telles que le type de fleur et le fait qu’elle possède ou non des feuilles. Par exemple, l’image suivante peut comporter les étiquettes au niveau de l’image euphorbe_méditerranéenne et sans_feuilles.

Gros plan d'une grappe de fleurs de viorne verte avec de petits fleurons serrés.

Pour ce type de modèle, attribuez des étiquettes au niveau de l’image pour chaque catégorie aux images des jeux de données d’entraînement et de test. Pour un exemple de projet, consultez Classification des images à plusieurs étiquettes.

Attribution d’étiquettes au niveau de l’image

Si les images sont stockées dans un compartiment Amazon S3, vous pouvez utiliser les noms de dossier pour ajouter automatiquement des étiquettes au niveau de l’image. Pour plus d’informations, consultez Compartiment Amazon S3. Vous pouvez également ajouter des étiquettes au niveau de l’image aux images après avoir créé un jeu de données. Pour plus d’informations, consultez Attribution d’étiquettes au niveau de l’image à une image. Vous pouvez ajouter de nouvelles étiquettes à votre convenance. Pour plus d’informations, consultez Gestion des étiquettes.

Recherche des emplacements d’objets

Pour créer un modèle qui prédit l’emplacement des objets dans vos images, vous devez définir des cadres de délimitation et des étiquettes pour les images dans les jeux de données d’entraînement et de test. Un cadre de délimitation entoure étroitement un objet. Par exemple, l’image suivante affiche un cadre de délimitation autour d’un appareil Amazon Echo et d’un appareil Amazon Echo Dot. Une étiquette est attribuée à chaque cadre de délimitation (Amazon Echo ou Amazon Echo Dot).

Deux haut-parleurs intelligents Amazon, l'un avec boîtier de délimitation vert et l'autre avec boîtier de délimitation bleu, sur une surface en bois.

Pour trouver les emplacements d’objets, les jeux de données doivent avoir au moins une étiquette. Pendant l’entraînement du modèle, une autre étiquette est automatiquement créée pour représenter la zone située en dehors des cadres de délimitation sur une image.

Attribution de cadres de délimitation

Lorsque vous créez le jeu de données, vous pouvez inclure des informations relatives aux cadres de délimitation pour vos images. Par exemple, vous pouvez importer un fichier manifeste au format SageMaker Ground Truth contenant des cadres de délimitation. Vous pouvez également ajouter des cadres de délimitation après avoir créé un jeu de données. Pour plus d’informations, consultez Étiquetage des objets à l’aide de cadres de délimitation. Vous pouvez ajouter de nouvelles étiquettes à votre convenance. Pour plus d’informations, consultez Gestion des étiquettes.

Recherche de l’emplacement d’une marque

Si vous souhaitez trouver l’emplacement d’une marque, telle qu’un logo et un personnage animé, vous pouvez utiliser deux types d’images différents pour les images du jeu de données d’entraînement.

  • Images représentant uniquement le logo. Chaque image a besoin d’une seule étiquette au niveau de l’image, qui représente le nom du logo. Par exemple, l’étiquette au niveau de l’image pour l’image suivante pourrait être Lambda.

    Logo Lambda en blanc sur fond orange.
  • Images contenant le logo à des emplacements naturels, comme un match de football ou un schéma architectural. Chaque image d’entraînement nécessite des cadres de délimitation qui entourent chaque instance du logo. Par exemple, l'image suivante montre un schéma architectural avec des cadres de délimitation étiquetés entourant les logos AWS Lambda et Amazon Pinpoint.

    Schéma de travail illustrant le service AWS Lambda qui transmet l'activité des utilisateurs à Amazon Pinpoint pour obtenir des recommandations.

Nous vous recommandons de ne pas combiner des étiquettes au niveau de l’image et des cadres de délimitation dans les images d’entraînement.

Les images de test nécessitent des cadres de délimitation qui entourent les instances de la marque que vous souhaitez trouver. Vous pouvez fractionner le jeu de données d’entraînement pour créer le jeu de données de test, uniquement si les images d’entraînement incluent des cadres de délimitation étiquetés. Si les images d’entraînement ne comportent que des étiquettes au niveau de l’image, vous devrez créer un jeu de données de test comprenant des images avec des cadres de délimitation étiquetés. Si vous entraînez un modèle pour qu’il trouve l’emplacement d’une marque, effectuez les actions indiquées dans Étiquetage des objets à l’aide de cadres de délimitation et Attribution d’étiquettes au niveau de l’image à une image en fonction de la façon dont vous étiquetez vos images.

L’exemple de projet Détection des marques montre comment Étiquettes personnalisées Amazon Rekognition utilise des cadres de délimitation étiquetés pour entraîner un modèle à rechercher les emplacements d’objets.

Exigences d’étiquetage pour les types de modèles

Utilisez le tableau suivant pour déterminer comment étiqueter vos images.

Vous pouvez combiner des étiquettes au niveau de l’image et des images étiquetées dans des cadres de délimitation dans un seul jeu de données. Dans ce cas, Étiquettes personnalisées Amazon Rekognition choisit de créer un modèle au niveau de l’image ou un modèle d’emplacement d’objets.

Exemple Images d’entraînement Images de test

Classification d’images

1 étiquette au niveau de l’image par image

1 étiquette au niveau de l’image par image

Classification à plusieurs étiquettes

Plusieurs étiquettes au niveau de l’image par image

Plusieurs étiquettes au niveau de l’image par image

Recherche de l’emplacement d’une marque

étiquettes au niveau de l’image (vous pouvez également utiliser des cadres de délimitation étiquetés)

Cadres de délimitation étiquetés

Recherche des emplacements d’objets

Cadres de délimitation étiquetés

Cadres de délimitation étiquetés