Localización de objetos en archivos de manifiesto - Rekognition

Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.

Localización de objetos en archivos de manifiesto

Puede importar imágenes etiquetadas con información de localización de objetos añadiendo líneas JSON en formato JSON del formato SageMaker Ground Truth Bounding Box Job Output a un archivo de manifiesto.

La información de la localización representa la ubicación de un objeto en una imagen. La ubicación se representa mediante un cuadro delimitador que rodea el objeto. La estructura del cuadro delimitador incluye las coordenadas superiores izquierdas del cuadro delimitador y su ancho y alto. Una línea JSON con formato de cuadro delimitador incluye los cuadros delimitadores de las ubicaciones de uno o varios objetos en una imagen y la clase de cada objeto de la imagen.

Un archivo de manifiesto está compuesto por una o varias líneas JSON y cada línea contiene la información de una sola imagen.

Cómo crear un archivo de manifiesto para la localización de objetos
  1. Cree un archivo de texto vacío.

  2. Añada una línea JSON por cada imagen que desee importar. La línea JSON debería tener un aspecto similar al siguiente.

    {"source-ref": "s3://bucket/images/IMG_1186.png", "bounding-box": {"image_size": [{"width": 640, "height": 480, "depth": 3}], "annotations": [{ "class_id": 1, "top": 251, "left": 399, "width": 155, "height": 101}, {"class_id": 0, "top": 65, "left": 86, "width": 220, "height": 334}]}, "bounding-box-metadata": {"objects": [{ "confidence": 1}, {"confidence": 1}], "class-map": {"0": "Echo", "1": "Echo Dot"}, "type": "groundtruth/object-detection", "human-annotated": "yes", "creation-date": "2013-11-18T02:53:27", "job-name": "my job"}}
  3. Guarde el archivo. Puede usar la extensión .manifest, pero no es obligatoria.

  4. Cree un conjunto de datos con el archivo que creó. Para obtener más información, consulte Para crear un conjunto de datos mediante un archivo de manifiesto en formato SageMaker Ground Truth (consola).

Líneas JSON de cuadros delimitadores de objetos

En esta sección, le indicamos cómo crear una línea JSON para una sola imagen. Por ejemplo, en la siguiente imagen se ven unos cuadros delimitadores alrededor de un Amazon Echo y un Amazon Echo Dot.

La siguiente es la línea JSON del cuadro delimitador de la imagen anterior.

{ "source-ref": "s3://custom-labels-bucket/images/IMG_1186.png", "bounding-box": { "image_size": [{ "width": 640, "height": 480, "depth": 3 }], "annotations": [{ "class_id": 1, "top": 251, "left": 399, "width": 155, "height": 101 }, { "class_id": 0, "top": 65, "left": 86, "width": 220, "height": 334 }] }, "bounding-box-metadata": { "objects": [{ "confidence": 1 }, { "confidence": 1 }], "class-map": { "0": "Echo", "1": "Echo Dot" }, "type": "groundtruth/object-detection", "human-annotated": "yes", "creation-date": "2013-11-18T02:53:27", "job-name": "my job" } }

Observe la siguiente información.

source-ref

(Obligatorio) La ubicación de Amazon S3 de la imagen. El formato es "s3://BUCKET/OBJECT_PATH". Las imágenes de un conjunto de datos importado tienen que estar almacenadas en un bucket de Amazon S3.

bounding-box

(Obligatorio) El atributo de etiqueta. Elija el nombre del campo. Incluye el tamaño de la imagen y los cuadros delimitadores de cada objeto detectado en la imagen. Deben estar presentes los metadatos correspondientes identificados por el nombre del campo con el parámetro -metadata adjunto. Por ejemplo, "bounding-box-metadata".

image_size

(Obligatorio) Una matriz de un solo elemento que contiene el tamaño de la imagen en píxeles.

  • height: (obligatorio) la altura de la imagen en píxeles.

  • width: (obligatorio) la profundidad de la imagen en píxeles.

  • depth: (obligatorio) el número de canales de la imagen. En la caso de las imágenes RGB, el valor es 3. Etiquetas personalizadas de Amazon Rekognition no lo utiliza actualmente, pero se debe indicar un valor.

annotations

(Obligatorio) Un conjunto de información sobre los cuadros delimitadores de cada objeto detectado en la imagen.

  • class_id: (obligatorio) se asigna a la etiqueta en class-map. En el ejemplo anterior, el objeto con el class_id de 1 es el Echo Dot de la imagen.

  • top: (obligatorio) la distancia desde la parte superior de la imagen hasta la parte superior del cuadro delimitador, en píxeles.

  • left: (obligatorio) la distancia desde la izquierda de la imagen hasta la izquierda del cuadro delimitador, en píxeles.

  • width: (obligatorio) el ancho del cuadro delimitador, en píxeles.

  • height: (obligatorio) la altura del cuadro delimitador, en píxeles.

bounding-box-metadata

(Obligatorio) Metadatos sobre el atributo de etiqueta. El nombre del campo debe ser el mismo que el del atributo de etiqueta con el parámetro -metadata adjunto. Un conjunto de información sobre los cuadros delimitadores de cada objeto detectado en la imagen.

Objects

(Obligatorio) Una matriz de objetos presente en la imagen. Se asigna a la matriz de annotations por índice. Etiquetas personalizadas de Amazon Rekognition no utiliza el atributo confidence.

class-map

(Obligatorio) El mapa de clases que se aplica a los objetos detectados en la imagen.

type

(Obligatorio) El tipo de trabajo de clasificación. "groundtruth/object-detection" identifica el trabajo como detección de objetos.

creation-date

(Obligatorio) La fecha y la hora en que se creó la etiqueta, según la hora universal coordinada (UTC).

human-annotated

(Obligatorio) Indique "yes" si la anotación la ha completado un humano. De lo contrario, "no".

job-name

(Opcional) El nombre del trabajo que procesa la imagen.