Amazon Rekognition
Guía del desarrollador

Detección de objetos y escenas

Esta sección proporciona información para detectar etiquetas en imágenes y vídeos con Amazon Rekognition Image y Amazon Rekognition Video.

Una etiqueta o marca es un objeto, escena o concepto encontrado en una imagen o vídeo basado en su contenido. Por ejemplo, una foto de varias personas en una playa tropical puede contener etiquetas como "Person", "Water", "Sand", "Palm Tree" y "Swimwear" (objetos), "Beach" (escena) y "Outdoors" (concepto). Amazon Rekognition Video también puede detectar actividades como una persona esquiando o montando en bicicleta. Amazon Rekognition Image no detecta actividades en imágenes.

Amazon Rekognition Image y Amazon Rekognition Video pueden devolver el cuadro delimitador de etiquetas de objetos comunes, como personas, automóviles, muebles, prendas de vestir o mascotas. La información del cuadro delimitador no se devuelve en el caso de las etiquetas de objetos menos comunes. Puede utilizar los cuadros delimitadores para encontrar las ubicaciones exactas de objetos en una imagen, contar cuántas veces aparece el objeto detectado o medir el tamaño de un objeto mediante las dimensiones del cuadro delimitador.

Amazon Rekognition Image y Amazon Rekognition Video utilizan una taxonomía jerárquica de etiquetas antecesoras para categorizar las etiquetas. Por ejemplo, una persona que está cruzando a pie la calle podría detectarse como Pedestrian (Peatón). La etiqueta principal de Pedestrian (Peatón) es Person (Persona). Ambas etiquetas se devuelven en la respuesta. Se devuelven todas las etiquetas antecesoras. Además, una etiqueta determinada contiene una lista de su etiqueta principal y demás etiquetas antecesoras. Por ejemplo, las etiquetas "abuelas" y "bisabuelas", si las hay. Puede utilizar etiquetas principales para crear grupos de etiquetas relacionadas y hacer posibles las consultas de etiquetas similares en una o varias imágenes. Por ejemplo, una consulta de todas las etiquetas Vehicle (Vehículo) podría devolver un automóvil de una imagen y una motocicleta de otra.

Amazon Rekognition Image y Amazon Rekognition Video devuelven la versión del modelo de detección de etiquetas que se ha utilizado para detectar etiquetas en una imagen o un vídeo almacenado.

Por ejemplo, en la imagen siguiente, Amazon Rekognition Image es capaz de detectar la presencia de una persona, un patinete, coches aparcados y otra información. Amazon Rekognition Image también devuelve el cuadro delimitador de una persona detectada y otros objetos detectados como automóviles o ruedas. Amazon Rekognition Video y Amazon Rekognition Image proporcionan además una puntuación de porcentaje sobre la confianza que tiene Amazon Rekognition en la precisión de cada etiqueta detectada.