Cómo decidir el tipo de modelo Crear un modelo Mejorar el modelo Iniciar el modelo Analizar una imagen Detener el modelo

Qué es Etiquetas personalizadas de Amazon Rekognition

En esta sección, se ofrece una descripción general del flujo de trabajo para entrenar y usar un modelo de etiquetas personalizadas de Amazon Rekognition con la consola y el SDK. AWS

nota

Etiquetas personalizadas de Amazon Rekognition se encarga de administrar los conjuntos de datos de un proyecto. Puede crear conjuntos de datos para sus proyectos con la consola y el SDK. AWS Si ha utilizado anteriormente Etiquetas personalizadas de Amazon Rekognition, es posible que tenga que asociar sus conjuntos de datos antiguos a un proyecto nuevo. Para obtener más información, consulte Paso 6: (Opcional) Asociar conjuntos de datos anteriores a nuevos proyectos.

Cómo decidir el tipo de modelo

Primero debe decidir qué tipo de modelo quiere entrenar, lo que depende de sus objetivos empresariales. Por ejemplo, puede entrenar un modelo para que encuentre un logotipo en las publicaciones de las redes sociales, identifique sus productos en las estanterías de las tiendas o clasifique las piezas de una máquina en una línea de montaje.

Etiquetas personalizadas de Amazon Rekognition puede entrenar los siguientes tipos de modelos:

Buscar objetos, escenas y conceptos
Buscar ubicaciones de objetos
Buscar ubicación de marcas

Para ayudarle a decidir qué tipo de modelo podría entrenar, Etiquetas personalizadas de Amazon Rekognition incluye algunos ejemplos de proyectos que puede utilizar. Para obtener más información, consulte Introducción a Etiquetas personalizadas de Amazon Rekognition.

Buscar objetos, escenas y conceptos

El modelo clasifica los objetos, las escenas y los conceptos que están asociados a una imagen completa. Por ejemplo, puede entrenar un modelo para que determine si una imagen contiene una atracción turística o no. Para ver un proyecto de ejemplo, consulte Clasificación de imágenes. La siguiente imagen de un lago es un ejemplo del tipo de imagen en la que se pueden reconocer objetos, escenas y conceptos.

Lago tranquilo que refleja nubes y montañas al atardecer o al amanecer.

También tiene la opción de entrenar un modelo que clasifique las imágenes en varias categorías. Por ejemplo, la imagen anterior puede incluir categorías como el color del cielo, un reflejo o un lago. Para ver un proyecto de ejemplo, consulte Clasificación de imágenes de etiquetas múltiples.

Buscar ubicaciones de objetos

El modelo predice la ubicación de un objeto en una imagen. La predicción incluye información del cuadro delimitador en la ubicación del objeto y una etiqueta que identifica el objeto dentro del cuadro delimitador. Por ejemplo, en la siguiente imagen aparecen unos cuadros delimitadores alrededor de varios componentes de una placa de circuito, como un comparador o un potenciómetro.

Imagen de componentes que muestra un LED IR, un resistor de potencia y un chip comparador en una placa de circuito.

En el proyecto de ejemplo Localización de objetos, se ve cómo Etiquetas personalizadas de Amazon Rekognition utiliza cuadros delimitadores etiquetados para entrenar un modelo que busca ubicaciones de objetos.

Buscar ubicación de marcas

Etiquetas personalizadas de Amazon Rekognition puede entrenar un modelo para que busque la ubicación de marcas, como los logotipos, en una imagen. La predicción incluye información del cuadro delimitador en la ubicación de la marca y una etiqueta que identifica el objeto dentro del cuadro delimitador. Para ver un proyecto de ejemplo, consulte Detección de marcas. La siguiente imagen es un ejemplo de algunas de las marcas que el modelo puede detectar.

Crear un modelo

El procedimiento para crear un modelo consiste en crear un proyecto, crear conjuntos de datos de entrenamiento y de prueba y entrenar el modelo.

Crear un proyecto

Un proyecto de Etiquetas personalizadas de Amazon Rekognition es un grupo de recursos necesarios para crear y administrar un modelo. El proyecto gestiona lo siguiente:

Conjuntos de datos: las imágenes y las etiquetas de imagen que se utilizan para entrenar un modelo. Un proyecto incluye un conjunto de datos de entrenamiento y un conjunto de datos de prueba.
Modelos: un modelo es un software que se entrena para buscar los conceptos, las escenas y los objetos que son exclusivos de su empresa o negocio. Puede haber varias versiones de un modelo en un proyecto.

Le recomendamos que utilice un proyecto para una sola aplicación práctica, como buscar componentes en una placa de circuito.

Puede crear un proyecto con la consola Amazon Rekognition Custom Labels y con la API. CreateProject Para obtener más información, consulte Creación de un proyecto.

Crear conjuntos de datos de entrenamiento y de prueba

Un conjunto de datos es un conjunto de imágenes y etiquetas que describen esas imágenes. Dentro del proyecto, se crea un conjunto de datos de entrenamiento y un conjunto de datos de prueba que Etiquetas personalizadas de Amazon Rekognition utiliza para entrenar y probar el modelo.

Una etiqueta identifica un objeto, una escena, un concepto o un cuadro delimitador alrededor del objeto de una imagen. Las etiquetas se asignan a una imagen completa (image-level) o se asignan a un cuadro delimitador que rodea el objeto de una imagen.

importante

La forma en que etiquete las imágenes en sus conjuntos de datos determina el tipo de modelo que se crea en Etiquetas personalizadas de Amazon Rekognition. Por ejemplo, para entrenar un modelo que busca objetos, escenas y conceptos, debe asignar etiquetas de imagen a las imágenes de sus conjuntos de datos de entrenamiento y de prueba. Para obtener más información, consulte Finalidad de los conjuntos de datos.

Las imágenes deben estar en formato PNG y JPEG y se deben seguir las recomendaciones de las imágenes de entrada. Para obtener más información, consulte Preparación de imágenes.

Crear conjuntos de datos de entrenamiento y de prueba (consola)

Puede empezar con un proyecto que tenga un único conjunto de datos o un proyecto que tenga conjuntos de datos de entrenamiento y de prueba independientes. Si empieza con un único conjunto de datos, Etiquetas personalizadas de Amazon Rekognition lo divide durante el entrenamiento para crear un conjunto de datos de entrenamiento (80 %) y un conjunto de datos de prueba (20 %) para su proyecto. Comience con un único conjunto de datos si quiere que Etiquetas personalizadas de Amazon Rekognition decida qué imágenes se van a usar para el entrenamiento y las pruebas. Para tener un control total sobre el entrenamiento, las pruebas y el nivel de rendimiento, le recomendamos que inicie el proyecto con conjuntos de datos de entrenamiento y de prueba independientes.

Para crear los conjuntos de datos para un proyecto, importe las imágenes a través de uno de los siguientes métodos:

Importar imágenes de un ordenador local.
Importar imágenes de un bucket de S3. Etiquetas personalizadas de Amazon Rekognition puede etiquetar las imágenes con los nombres de las carpetas que contienen las imágenes.
Importa un archivo de manifiesto de Amazon SageMaker Ground Truth.
Copiar un conjunto de datos existente de Etiquetas personalizadas de Amazon Rekognition.

Para obtener más información, consulte Creación de conjuntos de datos de entrenamiento y prueba.

Según el lugar desde el que importe las imágenes, es posible que no vengan etiquetadas. Por ejemplo, las imágenes importadas de un ordenador local no están etiquetadas. Las imágenes importadas de un archivo de manifiesto de Amazon SageMaker Ground Truth están etiquetadas. Puede utilizar la consola de Etiquetas personalizadas de Amazon Rekognition para agregar, cambiar y asignar etiquetas. Para obtener más información, consulte Etiquetado de imágenes.

Para crear sus conjuntos de datos de entrenamiento y de prueba en la consola, consulte Creación de conjuntos de datos de entrenamiento y prueba. Si quiere ver el tutorial sobre cómo crear conjuntos de datos de entrenamiento y de prueba, consulte Clasificación de imágenes.

Crear conjuntos de datos de entrenamiento y prueba (SDK)

Puede crear sus conjuntos de datos de entrenamiento y de prueba, use la API de CreateDataset. Puede crear un conjunto de datos mediante un archivo de manifiesto en formato Amazon SageMaker o copiando un conjunto de datos de Etiquetas personalizadas de Amazon Rekognition existente. Para obtener más información, consulte Cree conjuntos de datos de entrenamiento y prueba () SDK . Si es necesario, puede crear su propio archivo de manifiesto. Para obtener más información, consulte Creación de un archivo de manifiesto.

Entrenar su modelo

Entrene su modelo con el conjunto de datos de entrenamiento. Se creará una nueva versión del modelo cada vez que se entrena. Durante el entrenamiento, Etiquetas personalizadas de Amazon Rekognition comprueba el rendimiento del modelo entrenado. Puede utilizar los resultados para evaluar y mejorar el modelo. El entrenamiento tarda un tiempo en realizarse. Solo se le cobrará cuando termine de entrenarse por completo un modelo. Para obtener más información, consulte Entrenamiento de un modelo de Etiquetas personalizadas de Amazon Rekognition. Si el entrenamiento del modelo presenta problemas, Etiquetas personalizadas de Amazon Rekognition le dará información sobre la depuración de errores que puede utilizar. Para obtener más información, consulte Depuración de un modelo de entrenamiento con errores.

Entrenar el modelo (consola)

Para entrenar su modelo a través de la consola, consulte Entrenamiento de un modelo (consola).

Entrenamiento de un modelo (SDK)

Para entrenar un modelo de Amazon Rekognition Custom Labels, llame a Version. CreateProject Para obtener más información, consulte Entrenamiento de un modelo (SDK).

Mejorar el modelo

Durante las pruebas, Etiquetas personalizadas de Amazon Rekognition genera métricas de evaluación que puede usar para mejorar el modelo entrenado.

Evaluar el modelo

Evalúe el rendimiento del modelo mediante las métricas de rendimiento creadas durante las pruebas. Las métricas de rendimiento, como la puntuación F1, las de precisión y las de exhaustividad, le permiten conocer el rendimiento del modelo entrenado y decidir si es posible usarlo en la fase de producción. Para obtener más información, consulte Métricas para evaluar su modelo.

Evaluar un modelo (consola)

Para ver las métricas de rendimiento, consulte Acceso a las métricas de evaluación (consola).

Evaluar un modelo (SDK)

Para obtener las métricas de rendimiento, debe llamar a DescribeProjectVersions para obtener los resultados de las pruebas. Para obtener más información, consulte Acceso a las métricas de evaluación de Amazon Rekognition Custom Labels () SDK. Los resultados de las pruebas se representan con métricas que no están disponibles en la consola, como una matriz de confusión para los resultados de la clasificación. Los resultados de las pruebas se devuelven en los siguientes formatos:

Puntuación F1: un valor único que refleja el rendimiento general de precisión y exhaustividad del modelo. Para obtener más información, consulte F1.
Ubicación del archivo de resumen: el resumen de las pruebas incluye una serie de métricas de evaluación acumuladas de todo el conjunto de datos de pruebas y las métricas de cada etiqueta por separado. DescribeProjectVersions devuelve la ubicación del bucket de S3 y de la carpeta del archivo de resumen. Para obtener más información, consulte Acceder al archivo de resumen del modelo.
Ubicación del resumen del manifiesto de evaluación: este resumen incluye los detalles sobre los resultados de las pruebas, como los índices de confianza y los resultados de las pruebas de clasificación binaria, como los falsos positivos. DescribeProjectVersions devuelve la ubicación del bucket de S3 y de la carpeta de los archivos de resumen. Para obtener más información, consulte Interpretación de la instantánea del manifiesto de evaluación.

Mejorar el modelo

Si se necesitan mejoras, puede agregar más imágenes de entrenamiento o mejorar el etiquetado de los conjuntos de datos. Para obtener más información, consulte Mejora de un modelo de Etiquetas personalizadas de Amazon Rekognition. También puede aportar sus observaciones sobre las predicciones que haga su modelo y utilizarlos para mejorarlo. Para obtener más información, consulte Mejora de un modelo con comentarios sobre el modelo.

Mejorar el modelo (consola)

Para agregar imágenes a un conjunto de datos, consulte Añadir más imágenes a un conjunto de datos. Para agregar o cambiar etiquetas, consulte Etiquetado de imágenes.

Para volver a entrenar el modelo, consulte Entrenamiento de un modelo (consola).

Mejorar el modelo (SDK)

Para agregar imágenes a un conjunto de datos o cambiar el etiquetado de una imagen, usa la API de UpdateDatasetEntries. UpdateDatasetEntries actualiza o agrega líneas JSON a un archivo de manifiesto. Cada línea JSON contiene la información de una sola imagen, como las etiquetas asignadas o la información de los cuadros delimitadores. Para obtener más información, consulte Añadir más imágenes (SDK). Para ver las entradas de un conjunto de datos, usa la API de ListDatasetEntries.

Para volver a entrenar el modelo, consulte Entrenamiento de un modelo (SDK).

Iniciar el modelo

Antes de poder usar el modelo, debe iniciarlo a través de la consola de Etiquetas personalizadas de Amazon Rekognition o la API de StartProjectVersion. Se le cobrará por la cantidad de tiempo en que se ejecute el modelo. Para obtener más información, consulte Ejecución de un modelo de Etiquetas personalizadas de Amazon Rekognition.

Iniciar el modelo (consola)

Para iniciar el modelo con la consola, consulte Inicio de un modelo de Etiquetas personalizadas de Amazon Rekognition (consola).

Iniciar el modelo

El modelo se inicia llamando a StartProjectVersion. Para obtener más información, consulte Inicio de un modelo de Etiquetas personalizadas de Amazon Rekognition (SDK).

Analizar una imagen

Para analizar una imagen con el modelo, use la API de DetectCustomLabels. Puede indicar una imagen local o una imagen almacenada en un bucket de S3. La operación también requiere el nombre de recurso de Amazon (ARN) del modelo que desee utilizar.

Si el modelo encuentra objetos, escenas y conceptos, la respuesta incluirá una lista de etiquetas de imagen que se encuentran en la imagen. Por ejemplo, la siguiente imagen muestra las etiquetas de imagen que se encuentran en el proyecto de ejemplo Habitaciones.

Sala de estar con chimenea, sofá marrón, sillón, mesas de café y obras de arte escénicas en la pared. Las puertas conducen a un patio exterior.

Si el modelo encuentra ubicaciones de objetos, la respuesta incluirá una lista de los cuadros delimitadores etiquetados que se encuentran en la imagen. Un cuadro delimitador representa la ubicación de un objeto en una imagen. Puede utilizar la información del cuadro delimitador para dibujar un cuadro delimitador alrededor de un objeto. Por ejemplo, en la siguiente imagen aparecen unos cuadros delimitadores alrededor de los componentes de una placa de circuito que se han encontrado por medio del proyecto de ejemplo Placas de circuito.

Placa de circuito con LED IR, fototransistor y potenciómetro para ajustes.

Para obtener más información, consulte Análisis de una imagen con un modelo entrenado.

Detener el modelo

Se le cobrará por el tiempo de ejecución del modelo. Si ya no va a usar el modelo, deténgalo en la consola de Etiquetas personalizadas de Amazon Rekognition o mediante la API de StopProjectVersion. Para obtener más información, consulte Detención de un modelo de Etiquetas personalizadas de Amazon Rekognition.

Detener el modelo (consola)

Para detener la ejecución de un modelo con la consola, consulte Detención de un modelo de Etiquetas personalizadas de Amazon Rekognition (consola).

Detener el modelo (SDK)

Para detener un modelo en ejecución, llame a StopProject Version. Para obtener más información, consulte Detención de un modelo de Etiquetas personalizadas de Amazon Rekognition (SDK).

Aviso JavaScript está desactivado o no está disponible en su navegador.

Para utilizar la documentación de AWS, debe estar habilitado JavaScript. Para obtener más información, consulte las páginas de ayuda de su navegador.

Convenciones del documento

Paso 6: (Opcional) Asociar conjuntos de datos anteriores

Introducción