Especificaciones de imagen - Amazon Rekognition

Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.

Especificaciones de imagen

Las operaciones de Amazon Rekognition Image pueden analizar imágenes en formato .jpg o .png.

Puede pasar bytes de imágenes a una operación de Amazon Rekognition Image como parte de la llamada o hacer referencia a un objeto de S3 existente. Para un ejemplo de análisis de una imagen almacenada en un bucket de Amazon S3, consulte Análisis de imágenes almacenadas en un bucket de Amazon S3. Para ver un ejemplo del paso de bytes de imagen a una operación API en Amazon Rekognition Image, consulte Análisis de una imagen cargada desde un sistema de archivos local.

Si utiliza HTTP y transfiere los bytes de imagen como parte de una operación de Amazon Rekognition Image, dichos bytes deben pasarse como una cadena codificada en base64. Si utiliza el AWS SDK y transfiere los bytes de imagen como parte de la llamada a la operación API, el requisito de codificar en base64 los bytes de la imagen dependerá del lenguaje que utilice.

Los siguientes AWS SDK comunes cifran las imágenes en base64 automáticamente y no es necesario cifrar bytes de imagen antes de llamar a una operación de API de Amazon Rekognition Image.

  • Java

  • JavaScript

  • Python

  • PHP

Si utiliza otro AWS SDK y obtiene un error de formato de imagen al llamar a una operación API de Rekognition;, pruebe el cifrado en base64 de los bytes de imagen antes de transferirlos a una operación API de Rekognition.

Si utiliza la AWS CLI para llamar a las operaciones de Amazon Rekognition Image, no es posible transferir bytes de imágenes como parte de la llamada. Debe cargar primero la imagen en un bucket de Amazon S3 y, a continuación, llamar a la operación que hace referencia a la imagen cargada.

nota

No es necesario que la imagen esté cifrada en base64 si transfiere una imagen almacenada en un S3Object en lugar de bytes de imagen.

Para obtener información acerca de garantizar la mínima latencia posible para operaciones de Amazon Rekognition Image, consulte Latencia de operación de Amazon Rekognition Image.

Corrección de la orientación de imagen

En varias operaciones API de Rekognition, se devuelve la orientación de una imagen analizada. Conocer la orientación de imagen es importante, ya que le permite reorientar las imágenes para su visualización. Las operaciones de API de Rekognition que analizan rostros también devuelven cuadros delimitadores para la ubicación de rostros dentro de una imagen. Puede utilizar los cuadros delimitadores para mostrar un recuadro alrededor de un rostro en una imagen. Las coordenadas del cuadro delimitador devueltas se ven afectadas por la orientación de la imagen y es posible que tenga que traducir las coordenadas del cuadro delimitador para mostrar correctamente un cuadro alrededor de un rostro. Para obtener más información, consulte Obtención de coordenadas de cuadro delimitador y orientación de imagen.

Redimensionamiento de imagen

Durante el análisis, Amazon Rekognition cambia el tamaño interno de las imágenes mediante un conjunto de rangos predefinidos que mejor se adaptan a un modelo o algoritmo en particular. Por este motivo, Amazon Rekognition puede detectar un número diferente de objetos o proporcionar resultados distintos, en función de la resolución de la imagen de entrada. Por ejemplo, supongamos que tiene dos imágenes. La primera imagen tiene una resolución de 1024 x 768 píxeles. La segunda imagen, una versión redimensionada de la primera imagen, tiene una resolución de 640 x 480 píxeles. Si envías las imágenes a DetectLabels, las respuestas de las dos llamadas DetectLabels pueden diferir ligeramente.