Règles de validation des fichiers manifestes

Lorsque vous importez un fichier manifeste, Étiquettes personnalisées Amazon Rekognition applique des règles de validation pour les limites, la syntaxe et la sémantique. Le schéma SageMaker AI Ground Truth impose la validation syntaxique. Pour plus d’informations, consultez Sorties. Vous trouverez ci-dessous les règles de validation des limites et de la sémantique.

Note

Les règles de non-validité de 20 % s’appliquent cumulativement à toutes les règles de validation. Si l’importation dépasse la limite de 20 % en raison d’une combinaison quelconque, telle que 15 % de code JSON non valide et 15 % d’images non valides, l’importation échoue.
Chaque objet de jeu de données est une ligne dans le manifeste. Les lignes vierges/non valides sont également considérées comme des objets de jeu de données.
Les chevauchements correspondent aux (étiquettes communes entre le test et l’entraînement)/(étiquettes d’entraînement).

Limites

Validation	Limite	Erreur signalée
Taille du fichier manifeste	1 Go maximum	Erreur
Nombre maximal de lignes pour un fichier manifeste	Maximum de 250 000 objets de jeu de données sous forme de lignes dans un manifeste.	Erreur
Limite inférieure du nombre total d’objets de jeu de données valides par étiquette	>=1	Erreur
Limite inférieure au niveau des étiquettes	>=2	Erreur
Limite supérieure au niveau des étiquettes	<= 250	Erreur
Nombre minimal de cadres de délimitation par image	0	Aucun
Nombre maximal de cadres de délimitation par image	50	Aucun

Sémantique

Validation	Limite	Erreur signalée
Manifeste vide		Erreur
Objet source-ref manquant/inaccessible	Nombre d’objets inférieur à 20 %	Avertissement
Objet source-ref manquant/inaccessible	Nombre d’objets > 20 %	Erreur
Étiquettes de test non présentes dans le jeu de données d’entraînement	Au moins 50 % de chevauchement dans les étiquettes	Erreur
Combinaison d’exemples d’étiquettes et d’objets pour une même étiquette dans un jeu de données. Classification et détection pour la même classe dans un objet de jeu de données.		Aucune erreur ni aucun avertissement
Chevauchement des ressources entre le test et l’entraînement	Il ne doit pas y avoir de chevauchement entre les jeux de données de test et d’entraînement.
Les images d’un jeu de données doivent provenir du même compartiment	Erreur si les objets se trouvent dans un autre compartiment	Erreur

Avertissement JavaScript est désactivé ou n'est pas disponible dans votre navigateur.

Pour que vous puissiez utiliser la documentation AWS, Javascript doit être activé. Vous trouverez des instructions sur les pages d'aide de votre navigateur.

Conventions de rédaction

Localisation d’objets dans les fichiers manifestes

Conversion d'autres formats en fichier manifeste