Configuration automatisée des données source de trame vidéo - Amazon SageMaker

Configuration automatisée des données source de trame vidéo

Vous pouvez utiliser la configuration automatisée des données Ground Truth pour détecter automatiquement les fichiers vidéo dans votre compartiment Amazon S3 et extraire les trames vidéo de ces fichiers. Pour savoir comment procéder, veuillez consulter la section Fournir des fichiers vidéo.

Si vous avez déjà des trames vidéo dans Amazon S3, vous pouvez utiliser la configuration automatisée des données pour utiliser ces trames vidéo dans votre tâche d'étiquetage. Pour cette option, toutes les trames vidéo d'une seule vidéo doivent être stockées à l'aide d'un préfixe unique. Pour en savoir plus sur les conditions requises pour utiliser cette option, veuillez consulter Fournir des trames vidéo.

Sélectionnez l'une des sections suivantes pour savoir comment configurer votre connexion automatique de jeu de données source avec Ground Truth.

Utilisez la procédure suivante pour connecter vos fichiers vidéo avec Ground Truth et extraire automatiquement les trames vidéo de ces fichiers pour les tâches d'étiquetage de détection d'objets et de suivi d'objet dans les trames vidéo.

Note

Si vous utilisez l'outil de la console de configuration automatisée des données pour extraire des trames vidéo de plus de 10 fichiers vidéo, vous devez modifier le fichier manifeste généré par l'outil ou en créer un nouveau pour inclure 10 fichiers de séquence de trames vidéo ou moins. Pour en savoir plus, consultez Fournir des fichiers vidéo.

Assurez-vous que vos fichiers vidéo sont stockés dans un compartiment Amazon S3 situé dans la même région AWS que celle dans laquelle vous effectuez la configuration automatisée des données.

Connectez automatiquement vos fichiers vidéo dans Amazon S3 avec Ground Truth et extrayez des trames vidéo :

  1. Accédez à la page Create labeling job (Création d'une tâche d'étiquetage) dans la console Amazon SageMaker à l'adresse https://console.aws.amazon.com/sagemaker/groundtruth.

    Vos compartiments S3 d'entrée et de sortie doivent se situer dans la même région AWS que celle dans laquelle vous créez votre tâche d'étiquetage. Ce lien vous situe dans la région AWS de Virginie du Nord (us-east-1). Si vos données d'entrée se trouvent dans un compartiment Amazon S3 d'une autre région, spécifiez cette région. Pour modifier votre région AWS, dans la barre de navigation, choisissez le nom de la région actuellement affichée.

  2. Sélectionnez Create labeling job (Créer une tâche d'étiquetage).

  3. Saisissez un Job name (Nom de la tâche).

  4. Dans la section Input data setup (Configuration des données source), sélectionnez Automated data setup (Configuration automatisée des données).

  5. Saisissez un URI Amazon S3 pour S3 location for input datasets (Emplacement S3 pour les jeux de données source). Un URI S3 se présente comme suit : s3://DOC-EXAMPLE-BUCKET/path-to-files/. Cet URI doit pointer vers l'emplacement Amazon S3 où vos fichiers vidéo sont stockés.

  6. Spécifier votre S3 location for output datasets (Emplacement S3 pour les jeux de données de sortie). C'est l'endroit où vos données seront stockées. Vous pouvez choisir de stocker vos données de sortie dans le Same location as input dataset (Même emplacement que le jeu de données source) ou Specify a new location (Spécifier un nouvel emplacement) et en entrant l'URI S3 de l'emplacement où vous souhaitez stocker vos données de sortie.

  7. Choisissez Video Files (Fichiers vidéo) pour vos Data type (Type de données) en utilisant la liste déroulante.

  8. Choisissez Yes, extract frames for object tracking and detection tasks (Oui, extraire des trames pour les tâches de suivi et de détection des objets).

  9. Choisissez une méthode de Frame extraction (Extraction d'image).

    • Lorsque vous choisissez Use all frames extracted from the video to create a labeling task (Utiliser toutes les images extraites de la vidéo pour créer une tâche d'étiquetage), Ground Truth extrait toutes les images de chaque vidéo de votre Emplacement S3 pour les jeux de données source, jusqu'à 2 000 images. Si une vidéo de votre jeu de données source contient plus de 2 000 images, les 2 000 premières sont extraites et utilisées pour cette tâche d'étiquetage.

    • Lorsque vous choisissez Use every x frame from a video to create a labeling task (Utilisez une trame sur n d'une vidéo pour créer une tâche d'étiquetage), Ground Truth extrait une trame sur n de chaque vidéo dans votre Emplacement S3 pour les jeux de données source.

      Par exemple, si votre vidéo dure 2 secondes et qu'elle comporte une fréquence d'images de 30 images par seconde, il y a 60 images dans votre vidéo. Si vous spécifiez 10 ici, Ground Truth extrait une trame sur 10 de votre vidéo. Cela signifie que la 1e, 10e, 20e, 30e, 40e, 50e et 60e trames sont extraites.

  10. Choisissez ou créez un rôle d'exécution IAM. Assurez-vous que ce rôle est autorisé à accéder à vos emplacements Amazon S3 pour les données source et de sortie spécifiés aux étapes 5 et 6.

  11. Sélectionnez Complete data setup (Terminer la configuration des données).

Utilisez la procédure suivante pour connecter vos séquences de trames vidéo avec Ground Truth pour les tâches d'étiquetage de détection et de suivi d'objets dans les trames vidéo.

Assurez-vous que vos trames vidéo sont stockées dans un compartiment Amazon S3 situé dans la même région AWS que celle dans laquelle vous effectuez la configuration automatisée des données. Chaque séquence de trames vidéo doit avoir un préfixe unique. Par exemple, si vous avez deux séquences stockées dans s3://DOC-EXAMPLE-BUCKET/video-frames/sequences/, chacun doit avoir un préfixe unique, tels que sequence1 et sequence2, et doivent tous deux être situés directement sous le préfixe /sequences/. Dans l'exemple ci-dessus, les emplacements de ces deux séquences sont : s3://DOC-EXAMPLE-BUCKET/video-frames/sequences/sequence1/ et s3://DOC-EXAMPLE-BUCKET/video-frames/sequences/sequence2/.

Connectez automatiquement votre trame vidéo dans Amazon S3 avec Ground Truth :

  1. Accédez à la page Create labeling job (Création d'une tâche d'étiquetage) dans la console Amazon SageMaker à l'adresse https://console.aws.amazon.com/sagemaker/groundtruth.

    Vos compartiments S3 d'entrée et de sortie doivent se situer dans la même région AWS que celle dans laquelle vous créez votre tâche d'étiquetage. Ce lien vous situe dans la région AWS de Virginie du Nord (us-east-1). Si vos données d'entrée se trouvent dans un compartiment Amazon S3 d'une autre région, spécifiez cette région. Pour modifier votre région AWS, dans la barre de navigation, choisissez le nom de la région actuellement affichée.

  2. Sélectionnez Create labeling job (Créer une tâche d'étiquetage).

  3. Saisissez un Job name (Nom de la tâche).

  4. Dans la section Input data setup (Configuration des données source), sélectionnez Automated data setup (Configuration automatisée des données).

  5. Saisissez un URI Amazon S3 pour S3 location for input datasets (Emplacement S3 pour les jeux de données source).

    Il doit s'agir de l'emplacement Amazon S3 où vos séquences sont stockées. Par exemple, si vous avez deux séquences stockées dans s3://DOC-EXAMPLE-BUCKET/video-frames/sequences/sequence1/ et s3://DOC-EXAMPLE-BUCKET/video-frames/sequences/sequence2/, saisissez s3://DOC-EXAMPLE-BUCKET/video-frames/sequences/ ici.

  6. Spécifier votre S3 location for output datasets (Emplacement S3 pour les jeux de données de sortie). C'est l'endroit où vos données seront stockées. Vous pouvez choisir de stocker vos données de sortie dans le Same location as input dataset (Même emplacement que le jeu de données source) ou Specify a new location (Spécifier un nouvel emplacement) et en entrant l'URI S3 de l'emplacement où vous souhaitez stocker vos données de sortie.

  7. Choisissez Video frames (Trames vidéo) pour vos Data type (Type de données) en utilisant la liste déroulante.

  8. Choisissez ou créez un rôle d'exécution IAM. Assurez-vous que ce rôle est autorisé à accéder à vos emplacements Amazon S3 pour les données source et de sortie spécifiés aux étapes 5 et 6.

  9. Sélectionnez Complete data setup (Terminer la configuration des données).

Ces procédures créeront un manifeste source dans l'emplacement Amazon S3 pour les jeux de données source que vous avez spécifiés à l'étape 5. Si vous créez une tâche d'étiquetage à l'aide de l'API SageMaker, AWS CLI, ou un kit SDK AWS, utilisez l'URI Amazon S3 pour ce fichier manifeste source comme valeur pour le paramètre ManifestS3Uri.