Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.
Preparación de los conjuntos de datos de entrada
La creación de un adaptador requiere que proporcione a Rekognition dos conjuntos de datos, un conjunto de datos de entrenamiento y un conjunto de datos de prueba. Cada conjunto de datos se compone de dos elementos: imágenes y anotaciones/etiquetas. En las siguientes secciones se explica para qué se utilizan las etiquetas y las imágenes y cómo se combinan para crear conjuntos de datos.
Imágenes
Necesitará entrenar un adaptador con muestras representativas de sus imágenes. Cuando seleccione imágenes para el entrenamiento, intente incluir al menos algunas imágenes que demuestren la respuesta esperada para cada una de las etiquetas a las que se dirige con el adaptador.
Para crear un conjunto de datos de entrenamiento, debe proporcionar uno de los dos tipos de imágenes siguientes:
-
Imágenes con predicciones de falsos positivos. Por ejemplo, cuando un modelo base predice que una imagen contiene alcohol, pero no es así.
-
Imágenes con predicciones de falsos negativos. Por ejemplo, cuando un modelo base predice que una imagen no contiene alcohol, pero sí lo contiene.
Para crear un conjunto de datos equilibrado, se recomienda proporcionar uno de los dos tipos de imágenes siguientes:
-
Imágenes con predicciones verdaderamente positivas. Por ejemplo, cuando un modelo base predice correctamente que una imagen contiene alcohol. Se recomienda proporcionar estas imágenes si proporciona imágenes de falsos positivos.
-
Imágenes con predicciones de verdaderos negativos. Por ejemplo, cuando un modelo base predice correctamente que una imagen no contiene alcohol. Se recomienda proporcionar estas imágenes si proporciona imágenes de falsos negativos.
Etiquetas
Una etiqueta hace referencia a cualquiera de los siguientes elementos: objetos, eventos, conceptos o actividades. En el caso de la moderación de contenido, una etiqueta es una instancia de contenido inapropiado, no deseado u ofensivo.
En el contexto de la creación de un adaptador mediante el entrenamiento del modelo base de Rekognition, cuando se asigna una etiqueta a una imagen, se denomina anotación. Cuando entrene un adaptador con la consola de Rekognition, utilizará la consola para añadir anotaciones a las imágenes; para ello, deberá elegir una etiqueta y, a continuación, etiquetar las imágenes que se correspondan con la etiqueta. Mediante este proceso, el modelo aprende a identificar los elementos de las imágenes en función de la etiqueta asignada. Este proceso de vinculación permite que el modelo se centre en el contenido más relevante cuando se crea un adaptador, lo que mejora la precisión del análisis de imágenes.
Como alternativa, puede proporcionar un archivo de manifiesto que contenga información sobre las imágenes y las anotaciones que las acompañan.
Conjuntos de datos de entrenamiento y prueba
El conjunto de datos de entrenamiento es la base para ajustar el modelo y crear un adaptador personalizado. Debe proporcionar un conjunto de datos de entrenamiento anotado para que el modelo pueda aprender. El modelo aprende de este conjunto de datos para mejorar su rendimiento en el tipo de imágenes que usted proporciona.
Para mejorar la precisión, debes crear tu conjunto de datos de entrenamiento a partir de annotation/labeling imágenes. Puede lograr esto de dos maneras:
Asignación manual de etiquetas: puede usar la consola Rekognition para crear un conjunto de datos de entrenamiento cargando las imágenes que quiere que contenga su conjunto de datos y, a continuación, asignarles etiquetas manualmente.
Archivo de manifiesto: puede utilizar un archivo de manifiesto para entrenar el adaptador. El archivo de manifiesto contiene información sobre las anotaciones más precisas para sus imágenes de entrenamiento y pruebas, así como la ubicación de las imágenes de entrenamiento. Puede proporcionar el archivo de manifiesto cuando entrene un adaptador con APIs Rekognition o cuando utilice la consola. AWS
El conjunto de datos de prueba se utiliza para evaluar el rendimiento del adaptador después del entrenamiento. Para garantizar una evaluación fiable, el conjunto de datos de prueba se crea utilizando una parte del conjunto de datos de entrenamiento original que el modelo no haya visto antes. Este proceso garantiza que el rendimiento del adaptador se evalúe con nuevos datos, lo que crea mediciones y métricas precisas. Para obtener mejoras de precisión óptimas, consulte Prácticas recomendadas de adaptadores de entrenamiento.