Règles de validation des fichiers manifestes - Rekognition

Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.

Règles de validation des fichiers manifestes

Lorsque vous importez un fichier manifeste, Étiquettes personnalisées Amazon Rekognition applique des règles de validation pour les limites, la syntaxe et la sémantique. Le schéma SageMaker Ground Truth impose la validation de la syntaxe. Pour plus d’informations, consultez Sorties. Vous trouverez ci-dessous les règles de validation des limites et de la sémantique.

Note
  • Les règles de non-validité de 20 % s’appliquent cumulativement à toutes les règles de validation. Si l'importation dépasse la limite de 20 % en raison d'une combinaison, telle que 15 % d'images non valides JSON et 15 % d'images non valides, l'importation échoue.

  • Chaque objet de jeu de données est une ligne dans le manifeste. Les lignes vierges/non valides sont également considérées comme des objets de jeu de données.

  • Les chevauchements correspondent aux (étiquettes communes entre le test et l’entraînement)/(étiquettes d’entraînement).

Limites

Validation Limite Erreur signalée

Taille du fichier manifeste

1 Go maximum

Erreur

Nombre maximal de lignes pour un fichier manifeste

Maximum de 250 000 objets de jeu de données sous forme de lignes dans un manifeste.

Erreur

Limite inférieure du nombre total d’objets de jeu de données valides par étiquette

>=1

Erreur

Limite inférieure au niveau des étiquettes

>=2

Erreur

Limite supérieure au niveau des étiquettes

<= 250

Erreur

Nombre minimal de cadres de délimitation par image

0

Aucun

Nombre maximal de cadres de délimitation par image

50

Aucun

Sémantique

Validation Limite Erreur signalée

Manifeste vide

Erreur

Objet source-ref manquant/inaccessible

Nombre d’objets inférieur à 20 %

Avertissement

Objet source-ref manquant/inaccessible

Nombre d’objets > 20 %

Erreur

Étiquettes de test non présentes dans le jeu de données d’entraînement

Au moins 50 % de chevauchement dans les étiquettes

Erreur

Combinaison d’exemples d’étiquettes et d’objets pour une même étiquette dans un jeu de données. Classification et détection pour la même classe dans un objet de jeu de données.

Aucune erreur ni aucun avertissement

Chevauchement des ressources entre le test et l’entraînement

Il ne doit pas y avoir de chevauchement entre les jeux de données de test et d’entraînement.

Les images d’un jeu de données doivent provenir du même compartiment

Erreur si les objets se trouvent dans un autre compartiment

Erreur