Configuración automatizada de datos de entrada de fotogramas de vídeo - Amazon SageMaker

Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.

Configuración automatizada de datos de entrada de fotogramas de vídeo

Puede utilizar la configuración de datos automatizada de Ground Truth para detectar automáticamente los archivos de vídeo en su bucket de Amazon S3 y extraer fotogramas de vídeo de esos archivos. Para saber cómo hacerlo, consulte Proporcione archivos de vídeo.

Si ya tiene fotogramas de vídeo en Amazon S3, puede utilizar la configuración de datos automatizada para utilizar estos fotogramas de vídeo en su trabajo de etiquetado. Para esta opción, todos los fotogramas de vídeo de un único vídeo deben almacenarse con un prefijo único. Para obtener información sobre los requisitos para usar esta opción, consulte Proporcione fotogramas de vídeo.

Seleccione una de las siguientes secciones para aprender a configurar su conexión automática de conjuntos de datos de entrada con Ground Truth.

Utilice el siguiente procedimiento para conectar sus archivos de vídeo con Ground Truth y extraer automáticamente los fotogramas de vídeo de esos archivos para realizar trabajos de etiquetado con detección de objetos y seguimiento de objetos en fotogramas de vídeo.

nota

Si utiliza la herramienta de la consola de configuración de datos automatizada para extraer fotogramas de vídeo de más de 10 archivos de vídeo, tendrá que modificar el archivo de manifiesto que genera la herramienta o crear uno nuevo para incluir 10 archivos de secuencia de fotogramas de vídeo o menos. Para obtener más información, consulte Proporcione archivos de vídeo.

Asegúrese de que sus archivos de vídeo estén almacenados en un bucket de Amazon S3 en la misma región de AWS en la que realiza la configuración automática de datos.

Conecte automáticamente sus archivos de vídeo en Amazon S3 con Ground Truth y extraiga fotogramas de vídeo:
  1. Ve a la página Crear trabajo de etiquetado en la SageMaker consola de Amazon: https://console.aws.amazon.com/sagemaker/groundtruth.

    Los buckets de S3 de entrada y salida deben estar en la misma región de AWS en la que creó el trabajo de etiquetado. Este enlace lo ubica en la región de Virginia del Norte ( AWS us-east-1). Si los datos de entrada se encuentran en un bucket de Amazon S3 de otra región, cámbiese a esa región. Para cambiar su AWS región, en la barra de navegación, elija el nombre de la región que se muestra actualmente.

  2. Seleccione Crear trabajo de etiquetado.

  3. Ingrese un Job name (Nombre de trabajo).

  4. En la sección Configuración de datos de entrada, seleccione Configuración de datos automatizada.

  5. Introduzca un URI de Amazon S3 en la Ubicación de S3 para los conjuntos de datos de entrada. Un URI de S3 tiene el siguiente aspecto: s3://DOC-EXAMPLE-BUCKET/path-to-files/. Este URI debe apuntar a la ubicación de Amazon S3 en la que se almacenan los archivos de vídeo.

  6. Especifique su Ubicación de S3 para los conjuntos de datos de salida. Aquí es donde se almacenarán los datos de salida. Puede elegir almacenar los datos de salida en la Misma ubicación que el conjunto de datos de entrada o Especifique una nueva ubicación e introduzca el URI de S3 de la ubicación en la que desea almacenar los datos de salida.

  7. Elija Archivos de vídeo en Tipo de datos en la lista desplegable.

  8. Seleccione Sí, extraer fotogramas para las tareas de seguimiento y detección de objetos.

  9. Elija un método de Extracción de fotogramas.

    • Si elige Utilizar todos los fotogramas extraídos del vídeo para crear una tarea de etiquetado, Ground Truth extrae todos los fotogramas de cada vídeo en su ubicación de S3 para los conjuntos de datos de entrada, hasta un máximo de 2000 fotogramas. Si un vídeo del conjunto de datos de entrada contiene más de 2000 fotogramas, los primeros 2000 se extraen y se utilizan para esa tarea de etiquetado.

    • Cuando elige Utilizar cada x fotogramas de un vídeo para crear una tarea de etiquetado, Ground Truth extrae el xo fotograma de cada vídeo en su ubicación de S3 para los conjuntos de datos de entrada.

      Por ejemplo, si el vídeo dura 2 segundos y tiene una velocidad de fotograma de 30 fotogramas por segundo, hay 60 fotogramas en el vídeo. Si especifica 10 aquí, Ground Truth extrae cada 10o fotograma del vídeo. Esto significa que se extrae el 1o, el 10o, el 20o, el 30o, el 40o, el 50o y el 60o.

  10. Elija o cree un rol de ejecución de IAM. Asegúrese de que este rol tenga permiso para acceder a sus ubicaciones de Amazon S3 para los datos de entrada y salida especificados en los pasos 5 y 6.

  11. Seleccione Configuración de datos completa.

Utilice el siguiente procedimiento para conectar sus secuencias de fotogramas de vídeo con Ground Truth para trabajos de etiquetado con detección de objetos y seguimiento de objetos en fotogramas de vídeo.

Asegúrese de que sus fotogramas de vídeo estén almacenados en un bucket de Amazon S3 en la misma región de AWS en la que realiza la configuración automática de datos. Cada secuencia de fotogramas de vídeo debe tener un prefijo único. Por ejemplo, si tiene dos secuencias almacenadas en s3://DOC-EXAMPLE-BUCKET/video-frames/sequences/, cada una debe tener un prefijo como sequence1 y sequence2, y ambas deben estar directamente debajo del prefijo /sequences/. En el ejemplo anterior, las ubicaciones de estas dos secuencias son: s3://DOC-EXAMPLE-BUCKET/video-frames/sequences/sequence1/ y s3://DOC-EXAMPLE-BUCKET/video-frames/sequences/sequence2/.

Conecte automáticamente su fotograma de vídeo en Amazon S3 con Ground Truth:
  1. Ve a la página Crear trabajo de etiquetado en la SageMaker consola de Amazon: https://console.aws.amazon.com/sagemaker/groundtruth.

    Los buckets de S3 de entrada y salida deben estar en la misma región de AWS en la que creó el trabajo de etiquetado. Este enlace lo ubica en la región de Virginia del Norte ( AWS us-east-1). Si los datos de entrada se encuentran en un bucket de Amazon S3 de otra región, cámbiese a esa región. Para cambiar su AWS región, en la barra de navegación, elija el nombre de la región que se muestra actualmente.

  2. Seleccione Crear trabajo de etiquetado.

  3. Ingrese un Job name (Nombre de trabajo).

  4. En la sección Configuración de datos de entrada, seleccione Configuración de datos automatizada.

  5. Introduzca un URI de Amazon S3 en la Ubicación de S3 para los conjuntos de datos de entrada.

    Esta debe ser la ubicación de Amazon S3 en la que se almacenan las secuencias. Por ejemplo, si tiene dos secuencias almacenadas en s3://DOC-EXAMPLE-BUCKET/video-frames/sequences/sequence1/, s3://DOC-EXAMPLE-BUCKET/video-frames/sequences/sequence2/, introduzca s3://DOC-EXAMPLE-BUCKET/video-frames/sequences/ aquí.

  6. Especifique su Ubicación de S3 para los conjuntos de datos de salida. Aquí es donde se almacenarán los datos de salida. Puede elegir almacenar los datos de salida en la Misma ubicación que el conjunto de datos de entrada o Especifique una nueva ubicación e introduzca el URI de S3 de la ubicación en la que desea almacenar los datos de salida.

  7. Elija Fotogramas de vídeo en Tipo de datos en la lista desplegable.

  8. Elija o cree un rol de ejecución de IAM. Asegúrese de que este rol tenga permiso para acceder a sus ubicaciones de Amazon S3 para los datos de entrada y salida especificados en los pasos 5 y 6.

  9. Seleccione Configuración de datos completa.

Estos procedimientos crean un manifiesto de entrada en la ubicación de Amazon S3 para los conjuntos de datos de entrada que especificó en el paso 5. Si va a crear un trabajo de etiquetado mediante la SageMaker API o un AWS SDK AWS CLI, utilice el URI de Amazon S3 para este archivo de manifiesto de entrada como entrada al parámetroManifestS3Uri.