Choisir des fichiers vidéo ou des trames vidéo comme données source - Amazon SageMaker

Choisir des fichiers vidéo ou des trames vidéo comme données source

Lorsque vous créez une tâche d'étiquetage de détection ou de suivi d'objet de trame vidéo, vous pouvez fournir une séquence de trames vidéo (images) ou utiliser la console Amazon SageMaker pour que Ground Truth extraie automatiquement les trames vidéo de vos fichiers vidéo. Utilisez les sections suivantes pour en savoir plus sur ces options.

Fournir des trames vidéo

Les trames vidéo sont des séquences d'images extraites d'un fichier vidéo. Vous pouvez créer une tâche d'étiquetage Ground Truth pour que les employés étiquettent plusieurs séquences de trames vidéo. Chaque séquence est composée d'images extraites d'une seule vidéo.

Pour créer une tâche d'étiquetage à l'aide de séquences de trames vidéo, vous devez stocker chaque séquence à l'aide d'un préfixe de nom de clé dans Amazon S3. Dans la console Amazon S3, les préfixes de nom de clé sont appelés dossiers. Ainsi, dans la console Amazon S3, chaque séquence de trames vidéo doit se trouver dans son propre dossier dans Amazon S3.

Par exemple, si vous avez deux séquences de trames vidéo, vous pouvez utiliser les préfixes de nom de clé sequence1/ et sequence2/ pour identifier vos séquences. Dans cet exemple, vos séquences peuvent se trouver dans s3://DOC-EXAMPLE-BUCKET/video-frames/sequence1/ et s3://DOC-EXAMPLE-BUCKET/video-frames/sequence2/.

Si vous utilisez la console Ground Truth pour créer un fichier manifeste source, tous les préfixes de nom de clé de séquence doivent se trouver au même emplacement dans Amazon S3. Par exemple, dans la console Amazon S3, chaque séquence peut se trouver dans un dossier dans s3://DOC-EXAMPLE-BUCKET/video-frames/. Dans cet exemple, votre première séquence de trames vidéo (images) peut se trouver dans s3://DOC-EXAMPLE-BUCKET/video-frames/sequence1/ et votre deuxième séquence peut être située dans s3://DOC-EXAMPLE-BUCKET/video-frames/sequence2/.

Important

Même si vous n'avez qu'une seule séquence de trames vidéo que vous souhaitez étiqueter les employés, cette séquence doit avoir un préfixe de nom de clé dans Amazon S3. Si vous utilisez la console Amazon S3, cela signifie que votre séquence se trouve dans un dossier. Elle ne peut pas se situer à la racine de votre compartiment S3.

Lors de la création de tâches employé à l'aide de séquences de trames vidéo, Ground Truth utilise une séquence par tâche. Dans chaque tâche, Ground Truth trie vos trames vidéo en utilisant l'ordre binaire UTF-8.

Par exemple, les trames vidéo peuvent être dans l'ordre suivant dans Amazon S3 :

[0001.jpg, 0002.jpg, 0003.jpg, ..., 0011.jpg]

Ils sont disposés dans le même ordre dans la tâche de l'employé : 0001.jpg, 0002.jpg, 0003.jpg, ..., 0011.jpg.

Les trames peuvent également être triées à l'aide d'une convention de dénomination comme celle-ci :

[frame1.jpg, frame2.jpg, ..., frame11.jpg]

Dans ce cas, frame10.jpg et frame11.jpg viennent avant frame2.jpg dans la tâche employé. Votre employé voit vos trames vidéo dans l'ordre suivant : frame1.jpg, frame10.jpg, frame11.jpg, frame2.jpg, ..., frame9.jpg.

Fournir des fichiers vidéo

Vous pouvez utiliser la fonction de fractionnement de trames Ground Truth lors de la création d'une nouvelle tâche d'étiquetage dans la console pour extraire des trames vidéo à partir de fichiers vidéo (fichiers MP4). Une série de trames vidéo extraites d'un seul fichier vidéo est appelée séquence de trames vidéo.

Vous pouvez soit demander à Ground Truth d'extraire automatiquement toutes les trames de la vidéo, jusqu'à 2 000, ou vous pouvez spécifier une fréquence pour l'extraction des trames. Par exemple, vous pouvez extraire Ground Truth tous les 10e trame de vos vidéos.

Vous pouvez fournir jusqu'à 50 vidéos lorsque vous utilisez la configuration automatisée des données pour extraire des trames, mais votre fichier manifeste source ne peut pas faire référence à plus de 10 fichiers de séquence de trames vidéo lorsque vous créez une tâche d'étiquetage de suivi ou de détection d'objet de trame vidéo. Si vous utilisez l'outil de la console de configuration automatisée des données pour extraire des trames vidéo de plus de 10 fichiers vidéo, vous devez modifier le fichier manifeste généré par l'outil ou en créer un nouveau pour inclure 10 fichiers de séquence de trames vidéo ou moins. Pour en savoir plus sur les quotas , veuillez consulter Quotas de tâche d'étiquetage de nuage de points 3D et de trames vidéo.

Pour utiliser l'outil d'extraction de trame vidéo, veuillez consulter Configuration automatisée des données source de trame vidéo.

Lorsque toutes vos trames vidéo ont été extraites avec succès de vos vidéos, les éléments suivants s'affichent dans l'emplacement de votre jeu de données source S3 :

  • Un préfixe de nom de clé (un dossier dans la console Amazon S3) nommé d'après chaque vidéo. Chacun de ces préfixes conduit à :

    • Une séquence de trames vidéo extraites de la vidéo utilisée pour nommer ce préfixe.

    • Un fichier de séquence utilisé pour identifier toutes les images qui composent cette séquence.

  • Un fichier manifeste source avec une extension .manifest. Ceci identifie tous les fichiers de séquence qui seront utilisés pour créer votre tâche d'étiquetage.

Toutes les trames extraites d'un seul fichier vidéo sont utilisées pour une tâche d'étiquetage. Si vous extrayez des trames vidéo de plusieurs fichiers vidéo, plusieurs tâches sont créées pour votre tâche d'étiquetage, une pour chaque séquence de trames vidéo.

Ground Truth stocke chaque séquence de trames vidéo qu'il extrait dans votre emplacement Amazon S3 pour les jeux de données source à l'aide d'un préfixe de nom de clé. Dans la console Amazon S3, les préfixes de nom de clé sont appelés dossiers.