Descripción general del trabajo de etiquetado de fotogramas de vídeo - Amazon SageMaker

Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.

Descripción general del trabajo de etiquetado de fotogramas de vídeo

Utilice esta página para obtener información sobre los trabajos de etiquetado de fotogramas de vídeo con detección y seguimiento de objetos. La información de esta página se aplica a estos dos tipos de tareas integradas.

El trabajo de etiquetado de fotogramas de vídeo es único debido a lo siguiente:

  • Puede proporcionar objetos de datos listos para anotar (fotogramas de vídeo) o puede proporcionar archivos de vídeo y hacer que Ground Truth extraiga automáticamente los fotogramas de vídeo.

  • Los trabajadores tienen la capacidad de guardar trabajo sobre la marcha.

  • No puede utilizar la Amazon Mechanical Turk fuerza laboral para completar sus tareas de etiquetado.

  • Ground Truth proporciona una interfaz de usuario para los trabajadores, así como herramientas de etiquetado básicas y de asistencia, para ayudar a los trabajadores a completar sus tareas. No es necesario proporcionar una plantilla de tarea del trabajador.

Consulte los siguientes temas para obtener más información.

Datos de entrada

El trabajo de etiquetado de fotogramas de vídeo utiliza secuencias de fotogramas de vídeo. Una secuencia única es una serie de imágenes que se han extraído de un único vídeo. Puede proporcionar sus propias secuencias de fotogramas de vídeo o dejar que Ground Truth extraiga automáticamente las secuencias de fotogramas de vídeo de sus archivos de vídeo. Para obtener más información, consulte Proporcione archivos de vídeo.

Ground Truth utiliza archivos de secuencia para identificar todas las imágenes de una sola secuencia. Todas las secuencias que desee incluir en un solo trabajo de etiquetado se identifican en un archivo de manifiesto de entrada. Cada secuencia sirve para crear una única tarea del trabajador. Puede crear automáticamente archivos de secuencia y un archivo de manifiesto de entrada mediante la configuración automática de datos de Ground Truth. Para obtener más información, consulte Configuración automatizada de datos de entrada de fotogramas de vídeo.

Para aprender a crear manualmente archivos de secuencia y un archivo de manifiesto de entrada, consulte Cree un archivo de manifiesto de entrada de fotograma de vídeo.

Tiempos de finalización de trabajos

Los trabajadores pueden tardar horas en completar los trabajos de etiquetado de vídeo y fotogramas de vídeo. Puede establecer el tiempo total que los trabajadores pueden dedicar a cada tarea cuando crea un trabajo de etiquetado. El tiempo máximo que puede establecer para que los trabajadores trabajen en tareas es de 7 días. El valor predeterminado es 3 días.

Se recomienda encarecidamente crear tareas que los trabajadores puedan completar en un plazo de 12 horas. Los trabajadores deben mantener abierta la interfaz de usuario mientras trabajan en una tarea. Pueden guardar el trabajo según avanzan y Ground Truth lo guardará automáticamente cada 15 minutos.

Cuando utilice la operación de SageMaker CreateLabelingJob API, defina el tiempo total que una tarea estará disponible para los trabajadores en el TaskTimeLimitInSeconds parámetro deHumanTaskConfig.

Cuando crea un trabajo de etiquetado en la consola, puede especificar este límite de tiempo al seleccionar el tipo de personal y el equipo de trabajo.

Tipos de tareas

Cuando crea un trabajo de etiquetado de seguimiento o detección de objetos de vídeo, debe especificar el tipo de anotación que desea que creen los trabajadores mientras realizan la tarea de etiquetado. El tipo de anotación determina el tipo de datos de salida que devuelve Ground Truth y define el tipo de tarea de su trabajo de etiquetado.

Si está creando un trabajo de etiquetado mediante la operación de la API CreateLabelingJob, especifique el tipo de tarea mediante el parámetro del archivo de configuración de categorías de etiquetas annotationType. Para obtener más información, consulte Crear un archivo de configuración de categorías de etiquetado con atributos de categorías de etiquetas y fotogramas.

Los siguientes tipos de tareas están disponibles tanto para los trabajos de seguimiento de objetos de vídeo como para los de etiquetado de detección de objetos de vídeo:

  • Cuadro delimitador: los trabajadores disponen de herramientas para crear anotaciones en el cuadro delimitador. Un cuadro delimitador es un cuadro que un trabajador traza alrededor de un objeto para identificar la ubicación en píxeles y la etiqueta de ese objeto en el fotograma.

  • Polilínea: los trabajadores cuentan con herramientas para crear anotaciones de polilínea. Una polilínea se define mediante una serie de coordenadas x, y. Cada punto añadido a la polilínea se conecta al punto anterior mediante una línea. La polilínea no tiene que estar cerrada (el punto inicial y el punto final no tienen por qué ser el mismo) y no hay restricciones en cuanto a los ángulos que se forman entre las líneas.

  • Polilínea: los trabajadores cuentan con herramientas para crear anotaciones de polilínea. Una polilínea es una forma cerrada que se define mediante una serie de coordenadas x, y. Cada punto agregado al polígono se conecta al punto anterior mediante una línea y no hay restricciones en cuanto a los ángulos que se forman entre las líneas. No se pueden cruzar dos líneas (lados) de un polígono. El punto inicial y final de un polígono deben ser el mismo.

  • Punto clave: los trabajadores cuentan con herramientas para crear anotaciones de punto clave. Un punto clave es un punto único asociado a una coordenada x, y del fotograma de vídeo.

Personal

Cuando crea un trabajo de etiquetado de fotogramas de vídeo, debe especificar un equipo de trabajo que completará las tareas de anotación. Puede elegir un equipo de trabajo formado por personal privado de su propia plantilla o por personal del proveedor que seleccione en AWS Marketplace. No puede utilizar el personal de Amazon Mechanical Turk para tareas de etiquetado de fotogramas de vídeo.

Para obtener más información sobre el personal de proveedores, consulte Gestión de personal del proveedor.

Para aprender a crear y administrar personal privado, consulte Usar personal privado.

Interfaz de usuario (IU) del trabajador

Ground Truth proporciona una interfaz de usuario (IU) del trabajador, herramientas y características de etiquetado de apoyo para ayudar a los trabajadores a completar las tareas de etiquetado de vídeo. Es posible obtener una vista previa de la interfaz de usuario del trabajador al crear un trabajo de etiquetado en la consola.

Al crear un trabajo de etiquetado mediante la operación CreateLabelingJob de la API, debe suministrar un ARN facilitado por Ground Truth en el parámetro HumanTaskUiArn para especificar la interfaz de usuario del trabajador para el tipo de tarea. Puede utilizarla HumanTaskUiArn junto con la operación de SageMaker RenderUiTemplateAPI para obtener una vista previa de la interfaz de usuario del trabajador.

Usted proporciona instrucciones a los trabajadores, etiquetas y, opcionalmente, atributos que los trabajadores pueden utilizar para proporcionar más información sobre etiquetas y fotogramas de vídeo. Estos atributos se denominan atributos de categoría de etiqueta y atributos de fotograma, respectivamente. Todos se muestran en la interfaz de usuario del trabajador.

Atributos de categorías de etiquetas y fotogramas

Cuando crea un trabajo de etiquetado de seguimiento o detección de objetos de vídeo, puede añadir uno o más atributos de categoría de etiqueta y atributos de fotograma:

  • Atributo de categorías de etiquetas: una lista de opciones (cadenas), un cuadro de texto de formato libre o un campo numérico asociado a una o más etiquetas. Los trabajadores lo utilizan para proporcionar metadatos sobre una etiqueta.

  • Atributo de fotograma: una lista de opciones (cadenas), un cuadro de texto de formato libre o un campo numérico que aparece en cada fotograma de vídeo que se envía a un trabajador para anotar. Los trabajadores lo utilizan para proporcionar metadatos sobre fotogramas de vídeo.

Además, puede utilizar los atributos de etiqueta y fotograma para que los trabajadores verifiquen etiquetas en un trabajo de verificación de etiquetas de fotogramas de vídeo.

Utilice las siguientes secciones para obtener más información sobre estos atributos. Para aprender a agregar atributos de categoría de etiqueta y fotograma a un trabajo de etiquetado, utilice la sección Creación de trabajo de etiquetado de la página de tipo de tarea que prefiera.

Atributos de categorías de etiquetas

Agregue atributos de categoría a las etiquetas para que los trabajadores puedan proporcionar más información sobre las anotaciones que crean. Se añade un atributo de categorías de etiquetas a una etiqueta individual o a todas las etiquetas. Cuando un atributo de categorías de etiquetas se aplica a todas las etiquetas, se denomina atributo de categorías de etiquetas global.

Por ejemplo, si añade la categoría de etiqueta automóvil, también quizá convenga capturar datos adicionales sobre los automóviles etiquetados, por ejemplo, si están ocultos o el tamaño del automóvil. Para capturar estos metadatos puede utilizar atributos de categoría de etiqueta. En este ejemplo, si agregó el atributo oculto a la categoría de etiqueta de automóvil, puede asignar parcialmente, completamente, no al atributo oculto y permitir que los trabajadores seleccionen una de estas opciones.

Cuando crea un trabajo de verificación de etiquetas, se añaden los atributos de categoría a cada etiqueta que se desee que los trabajadores verifiquen.

Atributos de nivel de fotograma

Añada atributos de fotograma para que los trabajadores puedan proporcionar más información sobre fotogramas de vídeo individuales. Cada atributo de fotograma que añada aparecerá en todos los fotogramas.

Por ejemplo, puede añadir un atributo de fotograma de número para que los trabajadores identifiquen el número de objetos que ven en un fotograma específico.

En otro ejemplo, quizá convenga proporcionar un cuadro de texto de formato libre para que los trabajadores puedan responder a una pregunta.

Cuando crea un trabajo de verificación de etiquetas, puede añadir uno o más atributos de fotograma para pedir a los trabajadores que den su opinión sobre todas las etiquetas de un fotograma de vídeo.

Instrucciones de trabajo

Puede proporcionar instrucciones para ayudar a los trabajadores a completar las tareas de etiquetado de fotogramas de vídeo. Puede abordar los temas siguientes al redactar las instrucciones:

  • Prácticas recomendadas y aspectos que evitar al anotar objetos.

  • Atributos de categoría de etiqueta proporcionados (para tareas de detección y seguimiento de objetos) y cómo utilizarlos.

  • Cómo ahorrar tiempo al etiquetar utilizando atajos de teclado.

Puede añadir las instrucciones de su trabajador mediante la SageMaker consola mientras crea un trabajo de etiquetado. Si crea un trabajo de etiquetado mediante la operación CreateLabelingJob de la API, especifique las instrucciones de trabajo en el archivo de configuración de categoría de etiqueta.

Además de las instrucciones, Ground Truth proporciona un enlace para ayudar a los trabajadores a navegar y utilizar el portal del trabajador. Para ver estas instrucciones, seleccione el tipo de tarea en Instrucciones de trabajo.

Rechazar tareas

Los trabajadores pueden rechazar tareas.

Los trabajadores rechazan una tarea si las instrucciones no son claras, los datos de entrada no se muestran correctamente o si encuentran algún otro problema con la tarea. Si el número de trabajadores por objeto del conjunto de datos (NumberOfHumanWorkersPerDataObject) rechaza la tarea, el objeto de datos se marca como caducado y no se enviará a más trabajadores.

Requisitos de permiso para trabajos de fotogramas de vídeo

Al crear un trabajo de etiquetado de fotogramas de vídeo, además de los requisitos de permisos que se encuentran en Asigne permisos de IAM para usar Ground Truth, debe agregar una política CORS al bucket de S3 que contiene el archivo de manifiesto de entrada.

Agregar una política de permisos CORS al bucket de S3

Al crear un trabajo de etiquetado de fotogramas de vídeo, especifique los buckets en S3 donde se encuentran los datos de entrada y el archivo de manifiesto y donde se almacenarán los datos de salida. Estos buckets pueden ser los mismos. Debe asociar la siguiente política de intercambio de recursos de origen cruzado (CORS) a los buckets de entrada y salida. Si utiliza la consola de Amazon S3 para agregar la política a su bucket, debe utilizar el formato JSON.

JSON

[ { "AllowedHeaders": [ "*" ], "AllowedMethods": [ "GET", "HEAD", "PUT" ], "AllowedOrigins": [ "*" ], "ExposeHeaders": [ "Access-Control-Allow-Origin" ], "MaxAgeSeconds": 3000 } ]

XML

<?xml version="1.0" encoding="UTF-8"?> <CORSConfiguration xmlns="http://s3.amazonaws.com/doc/2006-03-01/"> <CORSRule> <AllowedOrigin>*</AllowedOrigin> <AllowedMethod>GET</AllowedMethod> <AllowedMethod>HEAD</AllowedMethod> <AllowedMethod>PUT</AllowedMethod> <MaxAgeSeconds>3000</MaxAgeSeconds> <ExposeHeader>Access-Control-Allow-Origin</ExposeHeader> <AllowedHeader>*</AllowedHeader> </CORSRule> </CORSConfiguration>

Para obtener información sobre cómo agregar una política CORS a un bucket de S3, consulte ¿Cómo añado la funcionalidad de uso compartido de recursos entre dominios con CORS? en la Guía del usuario de Amazon Simple Storage Service.