Configuration manuelle des données source - Amazon SageMaker

Configuration manuelle des données source

Choisissez l'option de configuration manuelle des données si vous avez créé des fichiers de séquence pour chacune de vos séquences de trames vidéo, ainsi qu'un fichier manifeste répertoriant les références à ces fichiers de séquences.

Création d'un fichier manifeste source de trame vidéo

Ground Truth utilise le fichier manifeste source pour identifier l'emplacement de votre jeu de données source lors de la création de tâches d'étiquetage. Pour les tâches d'étiquetage de détection et de suivi d'objet d'objets dans les trames vidéo, chaque ligne du fichier manifeste source identifie l'emplacement d'un fichier de séquence de trames vidéo. Chaque fichier de séquence identifie les images incluses dans une séquence unique de trames vidéo.

Utilisez cette page pour apprendre à créer un fichier de séquence de trames vidéo et un fichier manifeste source pour les tâches d'étiquetage de détection et de suivi d'objets dans les trames vidéo.

Si vous souhaitez que Ground Truth génère automatiquement vos fichiers de séquence et votre fichier manifeste source, veuillez consulter Configuration automatisée des données source de trame vidéo.

Créer un fichier manifeste source de trame vidéo

Dans le fichier manifeste source de séquence de trames vidéo, chaque ligne du manifeste est un objet JSON, où la clé "source-ref" fait référence à un fichier de séquence. Chaque fichier de séquence identifie l'emplacement d'une séquence de trames vidéo. Il s'agit du format de fichier manifeste requis pour toutes les tâches d'étiquetage de trames vidéo.

L'exemple suivant illustre la syntaxe utilisée pour un fichier manifeste source :

{"source-ref": "s3://DOC-EXAMPLE-BUCKET/example-folder/seq1.json"} {"source-ref": "s3://DOC-EXAMPLE-BUCKET/example-folder/seq2.json"}

Créer un fichier de séquence de trames vidéo

Les données de chaque séquence de trames vidéo doivent être stockées dans un objet de données JSON. Voici un exemple du format que vous utilisez pour un fichier de séquence. Les informations sur chaque trame sont incluses en tant qu'objet JSON et sont répertoriées dans la liste frames. Le JSON suivant a été développé pour plus de lisibilité.

{ "seq-no": 1, "prefix": "s3://mybucket/prefix/video1/", "number-of-frames": 3, "frames":[ {"frame-no": 1, "unix-timestamp": 1566861644, "frame": "frame0001.jpg" }, {"frame-no": 2, "unix-timestamp": 1566861644, "frame": "frame0002.jpg" }, {"frame-no": 3, "unix-timestamp": 1566861644, "frame": "frame0003.jpg" } ] }

Le tableau suivant fournit des détails sur les paramètres indiqués dans cet exemple de code.

Paramètre

Obligatoire

Valeurs acceptées

Description

seq-no

Oui

Entier

Numéro ordonné de la séquence.

prefix

Oui

Chaîne

Valeurs acceptées:

s3://<bucket-name>/<prefix>/

L'emplacement Amazon S3 où se trouvent les fichiers de séquence.

Le préfixe doit se terminer par une barre oblique: /.

number-of-frames

Oui

Entier

Nombre total de trames incluses dans le fichier de séquences. Ce nombre doit correspondre au nombre total de trames répertoriées dans le paramètre frames de la ligne suivante.

frames

Oui

Liste d'objets JSON

Obligatoire:

frame-no, frame

Facultatif:

unix-timestamp

Liste des données de trame. La longueur de la liste doit être égal à number-of-frames. Dans l'interface utilisateur employé, les trames d'une séquence sont classées dans l'ordre binaire UTF-8. Pour en savoir plus sur ce tri, veuillez consulter Fournir des trames vidéo.

frame-no

Oui

Entier

Le numéro d'ordre de la trame. Cela déterminera l'ordre d'une trame dans la séquence.

unix-timestamp

Non

Entier

L'horodatage Unix d'une trame. Le nombre de secondes écoulées depuis le 1er janvier 1970 jusqu'à l'heure UTC où la trame a été capturée.

frame

Oui

Chaîne

Le nom d'un fichier image de trame vidéo.