Mejora de un modelo de Etiquetas personalizadas de Amazon Rekognition - Rekognition

Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.

Mejora de un modelo de Etiquetas personalizadas de Amazon Rekognition

El rendimiento de los modelos de machine learning depende en gran medida de factores como la complejidad y la variabilidad de las etiquetas personalizadas (los objetos y escenas específicos que le interesen), la calidad y la capacidad representativa del conjunto de datos de entrenamiento que usa, los esquemas de modelos y los métodos de machine learning para entrenar el modelo.

Etiquetas personalizadas de Amazon Rekognition simplifica este proceso y no se requiere conocimientos de aprendizaje automático. Sin embargo, el proceso de creación de un buen modelo a menudo implica iteraciones sobre los datos y mejoras en el modelo para lograr el rendimiento deseado. A continuación, encontrará información sobre cómo mejorar su modelo.

Datos

En general, se puede mejorar la calidad del modelo con más cantidades de datos y de mejor calidad. Utilice imágenes de entrenamiento que muestren claramente el objeto o la escena y que no estén repletas de elementos innecesarios. Para delimitar los cuadros alrededor de los objetos, use imágenes de entrenamiento que reflejen el objeto de forma totalmente visible y no se vea obstaculizado por otros objetos.

Asegúrese de que los conjuntos de datos de entrenamiento y de prueba coincidan con el tipo de imágenes con las que vaya a realizar la inferencia. En el caso de los objetos, como los logotipos, en los que solo hay algunos ejemplos de entrenamiento, debes incluir cuadros delimitadores alrededor del logotipo en las imágenes de prueba. Estas imágenes representan o ilustran los escenarios en los que desea localizar el objeto.

Para agregar más imágenes a un conjunto de datos de entrenamiento o de prueba, consulte Añadir más imágenes a un conjunto de datos.

Reducción de los falsos positivos (mayor precisión)

  • En primer lugar, compruebe si el hecho de aumentar el umbral supuesto permite que las predicciones sean correctas y, al mismo tiempo, reducir los falsos positivos. En algún momento, esto merma los avances debido a la compensación entre precisión y exhaustividad en un modelo determinado. No se puede establecer el umbral supuesto de una etiqueta, pero se puede lograr el mismo resultado si se indica un valor alto en el parámetro de entrada MinConfidence en DetectCustomLabels. Para obtener más información, consulte Análisis de una imagen con un modelo entrenado.

  • Es posible que observe que una o varias de las etiquetas personalizadas que le interesan (A) se confunden constantemente con la misma clase de objetos (pero no con una etiqueta que le interese) (B). Para ayudarte, agregue B como etiqueta de clase de objeto al conjunto de datos de entrenamiento (junto con las imágenes en las que haya recibido el falso positivo). De hecho, así estará ayudando al modelo a saber predecir B y no A gracias a las nuevas imágenes de entrenamiento. Para agregar imágenes a un conjunto de datos de entrenamiento, consulte Añadir más imágenes a un conjunto de datos.

  • Es posible que dos de las etiquetas personalizadas (A y B) hagan confundir al modelo; se pronostica que la imagen de prueba con la etiqueta A tendrá la etiqueta B y viceversa. En ese caso, compruebe primero si hay imágenes mal etiquetadas en los conjuntos de entrenamiento y de prueba. Use la galería de conjuntos de datos para administrar las etiquetas asignadas a un conjunto de datos. Para obtener más información, consulte Administración de etiquetas. Además, si agrega más imágenes de entrenamiento relacionadas con este tipo de confusión hará que un modelo reentrenado discrimine mejor entre A y B. Para agregar imágenes a un conjunto de datos de entrenamiento, consulte Añadir más imágenes a un conjunto de datos.

Reducción de los falsos negativos (mejor exhaustividad)

  • Indique un valor inferior para el umbral supuesto. No se puede establecer el umbral supuesto de una etiqueta, pero se puede lograr el mismo resultado si se indica un valor bajo en el parámetro de entrada MinConfidence en DetectCustomLabels. Para obtener más información, consulte Análisis de una imagen con un modelo entrenado.

  • Use mejores ejemplos para que haya más variedad tanto del objeto como de las imágenes en las que aparecen.

  • Divida la etiqueta en dos clases que sean más fáciles de aprender. Por ejemplo, en lugar de galletas buenas y malas, tal vez prefiera galletas buenas, galletas quemadas y galletas en pedacitos para que el modelo pueda aprender mejor cada concepto único.