Proporcione fotogramas de vídeo Proporcione archivos de vídeo

Elija archivos de vídeo o fotogramas de vídeo para los datos de entrada

Al crear un trabajo de etiquetado de fotogramas de vídeo para detectar objetos o rastrear objetos, puede proporcionar una secuencia de fotogramas de vídeo (imágenes) o puede utilizar la consola Amazon SageMaker AI para que Ground Truth extraiga automáticamente los fotogramas de vídeo de sus archivos de vídeo. Utilice las siguientes secciones para obtener más información sobre estas opciones.

Proporcione fotogramas de vídeo

Los fotogramas de vídeo son secuencias de imágenes extraídas de un archivo de vídeo. Puede crear un trabajo de etiquetado de Ground Truth para que los trabajadores etiqueten varias secuencias de fotogramas de vídeo. Cada secuencia se compone de imágenes extraídas de un único vídeo.

Para crear un trabajo de etiquetado con secuencias de fotogramas de vídeo, debe almacenar cada secuencia con un prefijo de nombre de clave único en Amazon S3. En la consola de Amazon S3, los prefijos de nombres de claves se denominan carpetas. Por lo tanto, en la consola de Amazon S3, cada secuencia de fotogramas de vídeo debe estar ubicada en su propia carpeta en Amazon S3.

Por ejemplo, si tiene dos secuencias de fotogramas de vídeo, puede utilizar los prefijos de nombres de clave sequence1/ y sequence2/ para identificar las secuencias. En este ejemplo, las secuencias pueden estar en s3://amzn-s3-demo-bucket/video-frames/sequence1/ y s3://amzn-s3-demo-bucket/video-frames/sequence2/.

Si utiliza la consola de Ground Truth para crear un archivo de manifiesto de entrada, todos los prefijos de nombres de claves de secuencia deben estar en la misma ubicación en Amazon S3. Por ejemplo, en la consola de Amazon S3, cada secuencia podría estar en una carpeta en s3://amzn-s3-demo-bucket/video-frames/. En este ejemplo, la primera secuencia de fotogramas de vídeo (imágenes) puede estar en s3://amzn-s3-demo-bucket/video-frames/sequence1/ y la segunda secuencia puede estar en s3://amzn-s3-demo-bucket/video-frames/sequence2/.

importante

Incluso si solo tiene una secuencia de fotogramas de vídeo que desea que los trabajadores etiqueten, esa secuencia debe tener un prefijo de nombre de clave en Amazon S3. Si utiliza la consola de Amazon S3, eso significa que la secuencia se encuentra en una carpeta. No puede estar en la raíz del bucket de S3.

Cuando se crean tareas de los trabajadores mediante secuencias de fotogramas de vídeo, Ground Truth utiliza una secuencia por tarea. En cada tarea, Ground Truth ordena los fotogramas de vídeo utilizando el orden binario UTF-8.

Por ejemplo, los fotogramas de vídeo pueden estar en el siguiente orden en Amazon S3:


[0001.jpg, 0002.jpg, 0003.jpg, ..., 0011.jpg]

Se organizan en el mismo orden en la tarea del trabajador: 0001.jpg, 0002.jpg, 0003.jpg, ..., 0011.jpg.

Los fotogramas también se pueden ordenar utilizando una convención de nomenclatura como la siguiente:


[frame1.jpg, frame2.jpg, ..., frame11.jpg]

En este caso, frame10.jpg y frame11.jpg están antes que frame2.jpg en la tarea del trabajador. Su trabajador ve los fotogramas de vídeo en el siguiente orden: frame1.jpg, frame10.jpg, frame11.jpg, frame2.jpg, ..., frame9.jpg.

Proporcione archivos de vídeo

Puede utilizar la función de división de fotogramas Ground Truth al crear un nuevo trabajo de etiquetado en la consola para extraer fotogramas de vídeo de archivos de vídeo (MP4 archivos). La serie de fotogramas de vídeo que se extrae de un único archivo de vídeo se denomina secuencia de fotogramas de vídeo.

Puede hacer que Ground Truth extraiga automáticamente todos los fotogramas del vídeo, hasta 2000, o puede especificar una frecuencia de extracción de los fotogramas. Por ejemplo, puede hacer que Ground Truth extraiga cada décimo fotograma de los vídeos.

Puede proporcionar hasta 50 vídeos si utiliza la configuración de datos automatizada para extraer fotogramas; sin embargo, el archivo de manifiesto de entrada no puede hacer referencia a más de 10 archivos de secuencias de fotogramas de vídeo cuando crea un trabajo de etiquetado con seguimiento de objetos en fotogramas de vídeo y detección de objetos en fotogramas de vídeo. Si utiliza la herramienta de la consola de configuración de datos automatizada para extraer fotogramas de vídeo de más de 10 archivos de vídeo, tendrá que modificar el archivo de manifiesto que genera la herramienta o crear uno nuevo para incluir 10 archivos de secuencia de fotogramas de vídeo o menos. Para obtener más información acerca de estas cuotas, consulte Cuotas de trabajo de etiquetado de fotogramas de vídeo y nubes de puntos 3D.

Para utilizar la herramienta de extracción de fotogramas de vídeo, consulte Configuración automatizada de datos de entrada de fotogramas de vídeo.

Cuando todos los fotogramas de vídeo se hayan extraído correctamente de los vídeos, verá lo siguiente en la ubicación del conjunto de datos de entrada de S3:

Un prefijo de nombre de clave (una carpeta en la consola de Amazon S3) con el nombre de cada vídeo. Cada uno de estos prefijos conduce a lo siguiente:
- Secuencia de fotogramas de vídeo extraídos del vídeo utilizado para dar nombre a ese prefijo.
- Archivo de secuencia que se utiliza para identificar todas las imágenes que componen esa secuencia.
Archivo de manifiesto de entrada con la extensión .manifest. Esto identifica todos los archivos de secuencia que se utilizarán para crear el trabajo de etiquetado.

Todos los fotogramas extraídos de un único archivo de vídeo se utilizan para una tarea de etiquetado. Si extrae fotogramas de vídeo de varios archivos de vídeo, se crean varias tareas para el trabajo de etiquetado, una para cada secuencia de fotogramas de vídeo.

Ground Truth almacena cada secuencia de fotogramas de vídeo que extrae en su ubicación de Amazon S3 para los conjuntos de datos de entrada mediante un prefijo de nombre de clave único. En la consola de Amazon S3, los prefijos de nombres de claves se denominan carpetas.

Aviso JavaScript está desactivado o no está disponible en su navegador.

Para utilizar la documentación de AWS, debe estar habilitado JavaScript. Para obtener más información, consulte las páginas de ayuda de su navegador.

Convenciones del documento

Datos de entrada de fotogramas de vídeo

Configuración de los datos de entrada