Corrección de la orientación de imagen Redimensionamiento de imagen

Especificaciones de imagen

Las operaciones de Amazon Rekognition Image pueden analizar imágenes en formato .jpg o .png.

Puede pasar bytes de imágenes a una operación de Amazon Rekognition Image como parte de la llamada o hacer referencia a un objeto de S3 existente. Para un ejemplo de análisis de una imagen almacenada en un bucket de Amazon S3, consulte Análisis de imágenes almacenadas en un bucket de Amazon S3. Para ver un ejemplo del paso de bytes de imagen a una operación API en Amazon Rekognition Image, consulte Análisis de una imagen subida desde un sistema de archivos local.

Si utiliza HTTP y transfiere los bytes de imagen como parte de una operación de Amazon Rekognition Image, dichos bytes deben pasarse como una cadena codificada en base64. Si utiliza el AWS SDK y transfiere los bytes de imagen como parte de la llamada a la operación API, el requisito de codificar en base64 los bytes de la imagen dependerá del lenguaje que utilice.

Las siguientes opciones comunes codifican AWS SDKs automáticamente en base64 las imágenes y no es necesario codificar los bytes de las imágenes antes de llamar a una operación de la API Amazon Rekognition Image.

Java
JavaScript
Python
PHP

Si utiliza otro AWS SDK y obtiene un error de formato de imagen al llamar a una operación API de Rekognition;, pruebe el cifrado en base64 de los bytes de imagen antes de transferirlos a una operación API de Rekognition.

Si utilizas el AWS CLI para llamar a las operaciones de Amazon Rekognition Image, no se admite el paso de bytes de imagen como parte de la llamada. Debe subir primero la imagen en un bucket de Amazon S3 y, a continuación, llamar a la operación que hace referencia a la imagen subida.

nota

No es necesario que la imagen esté cifrada en base64 si transfiere una imagen almacenada en un S3Object en lugar de bytes de imagen.

Para obtener información acerca de garantizar la mínima latencia posible para operaciones de Amazon Rekognition Image, consulte Latencia de operación de Amazon Rekognition Image.

Corrección de la orientación de imagen

En varias operaciones API de Rekognition, se devuelve la orientación de una imagen analizada. Conocer la orientación de imagen es importante, ya que le permite reorientar las imágenes para su visualización. Las operaciones de API de Rekognition que analizan rostros también devuelven cuadros delimitadores para la ubicación de rostros dentro de una imagen. Puede utilizar los cuadros delimitadores para mostrar un recuadro alrededor de un rostro en una imagen. Las coordenadas del cuadro delimitador devueltas se ven afectadas por la orientación de la imagen y es posible que tenga que traducir las coordenadas del cuadro delimitador para mostrar correctamente un cuadro alrededor de un rostro. Para obtener más información, consulte Obtención de coordenadas de cuadro delimitador y orientación de imagen.

Redimensionamiento de imagen

Durante el análisis, Amazon Rekognition cambia el tamaño interno de las imágenes mediante un conjunto de rangos predefinidos que mejor se adaptan a un modelo o algoritmo en particular. Por este motivo, Amazon Rekognition puede detectar un número diferente de objetos o proporcionar resultados distintos, en función de la resolución de la imagen de entrada. Por ejemplo, supongamos que tiene dos imágenes. La primera imagen tiene una resolución de 1024 x 768 píxeles. La segunda imagen, una versión redimensionada de la primera imagen, tiene una resolución de 640 x 480 píxeles. Si envía las imágenes a DetectLabels, las respuestas de las dos llamadas DetectLabels pueden diferir ligeramente.

Aviso JavaScript está desactivado o no está disponible en su navegador.

Para utilizar la documentación de AWS, debe estar habilitado JavaScript. Para obtener más información, consulte las páginas de ayuda de su navegador.

Convenciones del documento

Trabajar con imágenes

Análisis de imágenes almacenadas en un bucket de Amazon S3;