Configuration des données d'entrée d'images vidéo automatisées - Amazon SageMaker

Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.

Configuration des données d'entrée d'images vidéo automatisées

Vous pouvez utiliser la configuration automatisée des données Ground Truth pour détecter automatiquement les fichiers vidéo dans votre compartiment Amazon S3 et extraire les trames vidéo de ces fichiers. Pour savoir comment procéder, veuillez consulter la section Fournir des fichiers vidéo.

Si vous avez déjà des trames vidéo dans Amazon S3, vous pouvez utiliser la configuration automatisée des données pour utiliser ces trames vidéo dans votre tâche d'étiquetage. Pour cette option, toutes les trames vidéo d'une seule vidéo doivent être stockées à l'aide d'un préfixe unique. Pour en savoir plus sur les conditions requises pour utiliser cette option, veuillez consulter Fournir des trames vidéo.

Sélectionnez l'une des sections suivantes pour savoir comment configurer votre connexion automatique de jeu de données source avec Ground Truth.

Utilisez la procédure suivante pour connecter vos fichiers vidéo avec Ground Truth et extraire automatiquement les trames vidéo de ces fichiers pour les tâches d'étiquetage de détection d'objets et de suivi d'objet dans les trames vidéo.

Note

Si vous utilisez l'outil de la console de configuration automatisée des données pour extraire des trames vidéo de plus de 10 fichiers vidéo, vous devez modifier le fichier manifeste généré par l'outil ou en créer un nouveau pour inclure 10 fichiers de séquence de trames vidéo ou moins. Pour en savoir plus, consultez Fournir des fichiers vidéo.

Assurez-vous que vos fichiers vidéo sont stockés dans un compartiment Amazon S3 situé dans la même région AWS que celle dans laquelle vous effectuez la configuration automatisée des données.

Connectez automatiquement vos fichiers vidéo dans Amazon S3 avec Ground Truth et extrayez des trames vidéo :
  1. Accédez à la page Créer une tâche d'étiquetage dans la SageMaker console Amazon : https://console.aws.amazon.com/sagemaker/groundtruth.

    Vos compartiments S3 d'entrée et de sortie doivent se situer dans la même région AWS que celle dans laquelle vous créez votre tâche d'étiquetage. Ce lien vous place dans la région de Virginie du Nord (us-east-1). AWS Si vos données d'entrée se trouvent dans un compartiment Amazon S3 d'une autre région, spécifiez cette région. Pour changer de AWS région, dans la barre de navigation, choisissez le nom de la région actuellement affichée.

  2. Sélectionnez Create labeling job (Créer une tâche d'étiquetage).

  3. Saisissez un Job name (Nom de la tâche).

  4. Dans la section Input data setup (Configuration des données source), sélectionnez Automated data setup (Configuration automatisée des données).

  5. Entrez un emplacement Amazon S3 URI pour S3 pour les ensembles de données d'entrée. Un S3 URI ressemble à ce qui suit :s3://amzn-s3-demo-bucket/path-to-files/. Cela URI devrait indiquer l'emplacement Amazon S3 où vos fichiers vidéo sont stockés.

  6. Spécifier votre S3 location for output datasets (Emplacement S3 pour les jeux de données de sortie). C'est l'endroit où vos données seront stockées. Vous pouvez choisir de stocker vos données de sortie au même emplacement que le jeu de données en entrée ou de spécifier un nouvel emplacement et de saisir le S3 URI de l'emplacement dans lequel vous souhaitez stocker vos données de sortie.

  7. Choisissez Video Files (Fichiers vidéo) pour vos Data type (Type de données) en utilisant la liste déroulante.

  8. Choisissez Yes, extract frames for object tracking and detection tasks (Oui, extraire des trames pour les tâches de suivi et de détection des objets).

  9. Choisissez une méthode de Frame extraction (Extraction d'image).

    • Lorsque vous choisissez Use all frames extracted from the video to create a labeling task (Utiliser toutes les images extraites de la vidéo pour créer une tâche d'étiquetage), Ground Truth extrait toutes les images de chaque vidéo de votre Emplacement S3 pour les jeux de données source, jusqu'à 2 000 images. Si une vidéo de votre jeu de données source contient plus de 2 000 images, les 2 000 premières sont extraites et utilisées pour cette tâche d'étiquetage.

    • Lorsque vous choisissez Utiliser tous x image d'une vidéo pour créer une tâche d'étiquetage, Ground Truth extrait chaque xl'image de chaque vidéo de votre emplacement S3 pour les ensembles de données d'entrée.

      Par exemple, si votre vidéo dure 2 secondes et qu'elle comporte une fréquence d'images de 30 images par seconde, il y a 60 images dans votre vidéo. Si vous spécifiez 10 ici, Ground Truth extrait une trame sur 10 de votre vidéo. Cela signifie que la 1e, 10e, 20e, 30e, 40e, 50e et 60e trames sont extraites.

  10. Choisissez ou créez un rôle IAM d'exécution. Assurez-vous que ce rôle est autorisé à accéder à vos emplacements Amazon S3 pour les données source et de sortie spécifiés aux étapes 5 et 6.

  11. Sélectionnez Complete data setup (Terminer la configuration des données).

Utilisez la procédure suivante pour connecter vos séquences de trames vidéo avec Ground Truth pour les tâches d'étiquetage de détection et de suivi d'objets dans les trames vidéo.

Assurez-vous que vos trames vidéo sont stockées dans un compartiment Amazon S3 situé dans la même région AWS que celle dans laquelle vous effectuez la configuration automatisée des données. Chaque séquence de trames vidéo doit avoir un préfixe unique. Par exemple, si vous avez deux séquences stockées dans s3://amzn-s3-demo-bucket/video-frames/sequences/, chacun doit avoir un préfixe unique, tels que sequence1 et sequence2, et doivent tous deux être situés directement sous le préfixe /sequences/. Dans l'exemple ci-dessus, les emplacements de ces deux séquences sont : s3://amzn-s3-demo-bucket/video-frames/sequences/sequence1/ et s3://amzn-s3-demo-bucket/video-frames/sequences/sequence2/.

Connectez automatiquement votre trame vidéo dans Amazon S3 avec Ground Truth :
  1. Accédez à la page Créer une tâche d'étiquetage dans la SageMaker console Amazon : https://console.aws.amazon.com/sagemaker/groundtruth.

    Vos compartiments S3 d'entrée et de sortie doivent se situer dans la même région AWS que celle dans laquelle vous créez votre tâche d'étiquetage. Ce lien vous place dans la région de Virginie du Nord (us-east-1). AWS Si vos données d'entrée se trouvent dans un compartiment Amazon S3 d'une autre région, spécifiez cette région. Pour changer de AWS région, dans la barre de navigation, choisissez le nom de la région actuellement affichée.

  2. Sélectionnez Create labeling job (Créer une tâche d'étiquetage).

  3. Saisissez un Job name (Nom de la tâche).

  4. Dans la section Input data setup (Configuration des données source), sélectionnez Automated data setup (Configuration automatisée des données).

  5. Entrez un emplacement Amazon S3 URI pour S3 pour les ensembles de données d'entrée.

    Il doit s'agir de l'emplacement Amazon S3 où vos séquences sont stockées. Par exemple, si vous avez deux séquences stockées dans s3://amzn-s3-demo-bucket/video-frames/sequences/sequence1/ et s3://amzn-s3-demo-bucket/video-frames/sequences/sequence2/, saisissez s3://amzn-s3-demo-bucket/video-frames/sequences/ ici.

  6. Spécifier votre S3 location for output datasets (Emplacement S3 pour les jeux de données de sortie). C'est l'endroit où vos données seront stockées. Vous pouvez choisir de stocker vos données de sortie au même emplacement que le jeu de données en entrée ou de spécifier un nouvel emplacement et de saisir le S3 URI de l'emplacement dans lequel vous souhaitez stocker vos données de sortie.

  7. Choisissez Video frames (Trames vidéo) pour vos Data type (Type de données) en utilisant la liste déroulante.

  8. Choisissez ou créez un rôle IAM d'exécution. Assurez-vous que ce rôle est autorisé à accéder à vos emplacements Amazon S3 pour les données source et de sortie spécifiés aux étapes 5 et 6.

  9. Sélectionnez Complete data setup (Terminer la configuration des données).

Ces procédures créeront un manifeste source dans l'emplacement Amazon S3 pour les jeux de données source que vous avez spécifiés à l'étape 5. Si vous créez une tâche d'étiquetage en utilisant le SageMaker API ou AWS CLI, ou un AWS SDK, utilisez Amazon S3 URI pour ce fichier manifeste d'entrée comme entrée pour le paramètreManifestS3Uri.