Configuración manual de los datos de entrada - Amazon SageMaker

Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.

Configuración manual de los datos de entrada

Elija la opción de configuración manual de datos si ha creado archivos de secuencia para cada una de las secuencias de fotogramas de vídeo y un archivo de manifiesto con las referencias a esos archivos de secuencias.

Cree un archivo de manifiesto de entrada de fotograma de vídeo

Ground Truth usa el archivo de manifiesto de entrada para identificar la ubicación del conjunto de datos de entrada al crear tareas de etiquetado. Para los trabajos de etiquetado con detección y seguimiento de objetos en fotogramas de vídeo, cada línea del archivo de manifiesto de entrada identifica la ubicación de un archivo de secuencia de fotogramas de vídeo. Cada archivo de secuencia identifica las imágenes incluidas en una sola secuencia de fotogramas de vídeo.

Utilice esta página para aprender a crear un archivo de secuencia de fotogramas de vídeo y un archivo de manifiesto de entrada para los trabajos de etiquetado con detección de objetos y seguimiento de objetos en fotogramas de vídeo.

Si desea que Ground Truth genere automáticamente sus archivos de secuencia y el archivo de manifiesto de entrada, consulte Configuración automatizada de datos de entrada de fotogramas de vídeo.

Cree un manifiesto de entrada de secuencias de fotogramas de vídeo

En el archivo de manifiesto de entrada de la secuencia de fotogramas de vídeo, cada línea del manifiesto es un objeto JSON, con una clave "source-ref" que hace referencia a un archivo de secuencia. Cada archivo de secuencia identifica la ubicación de una secuencia de fotogramas de vídeo. Este es el formato de archivo de manifiesto necesario para todos los trabajos de etiquetado de fotogramas de vídeo.

En el ejemplo siguiente, se muestra la sintaxis utilizada para un archivo de manifiesto de entrada:

{"source-ref": "s3://DOC-EXAMPLE-BUCKET/example-folder/seq1.json"} {"source-ref": "s3://DOC-EXAMPLE-BUCKET/example-folder/seq2.json"}

Cree un archivo de secuencia de fotogramas de vídeo

Los datos de cada secuencia de fotogramas de vídeo deben almacenarse en un objeto de datos JSON. A continuación se muestra un ejemplo del formato utilizado para un archivo de secuencia. La información sobre cada fotograma se incluye como un objeto JSON y se muestra en la lista frames. Se ha expandido el siguiente JSON para facilitar la lectura.

{ "seq-no": 1, "prefix": "s3://mybucket/prefix/video1/", "number-of-frames": 3, "frames":[ {"frame-no": 1, "unix-timestamp": 1566861644, "frame": "frame0001.jpg" }, {"frame-no": 2, "unix-timestamp": 1566861644, "frame": "frame0002.jpg" }, {"frame-no": 3, "unix-timestamp": 1566861644, "frame": "frame0003.jpg" } ] }

En la siguiente tabla, se proporcionan detalles sobre los parámetros que se muestran en el ejemplo de código.

Parámetro

Obligatorio

Valores aceptados

Descripción

seq-no

Entero

El número de orden de la secuencia.

prefix

Cadena

Valores aceptados:

s3://<bucket-name>/<prefix>/

La ubicación de Amazon S3 en la que se encuentran los archivos de secuencia.

El prefijo debe terminar con una barra diagonal: /.

number-of-frames

Entero

El número total de fotogramas incluidos en el archivo de secuencia. Este número debe coincidir con el número total de fotogramas enumerados en el parámetro frames de la siguiente fila.

frames

Lista de objetos JSON.

Obligatorio

frame-no, frame

Opcional:

unix-timestamp

Una lista de datos de fotograma. La longitud de la lista debe ser igual al number-of-frames. En la interfaz de usuario del trabajador, los fotogramas de una secuencia se clasifican en orden binario UTF-8. Para obtener más información sobre este tipo de ordenación, consulte Proporcione fotogramas de vídeo.

frame-no

Entero

El número de ordenación de los fotogramas. Esto determina el orden de un fotograma en la secuencia.

unix-timestamp

No

Entero

La marca de tiempo en Unix de un fotograma. El número de segundos transcurridos desde el 1 de enero de 1970 hasta la hora UTC en que se capturó el fotograma.

frame

Cadena

El nombre de un archivo de imagen de fotograma de vídeo.