Clasificación binaria

El resultado real de muchos algoritmos de clasificación binaria es una puntuación de predicción. La puntuación indica la certeza del modelo de que la observación dada pertenezca a la clase positiva. Para tomar la decisión sobre si la observación debe clasificarse como positiva o negativa, como consumidor de esta puntuación, interpretará la puntuación seleccionando un umbral de clasificación (corte) y comparará la puntuación con dicho umbral. Cualquier observación con puntuaciones superiores al umbral se prevé como la clase positiva y las puntuaciones inferiores al umbral se prevén como la clase negativa.

Figura 1: distribución de puntuaciones para el modelo de clasificación binaria

Las predicciones ahora se dividen en cuatro grupos en función de la respuesta conocida real, así como la respuesta predicha: predicciones positivas correctas (positivas reales), predicciones negativas correctas (negativas reales), predicciones positivas incorrectas (positivas falsas) y predicciones negativas incorrectas (negativas falsas).

Las métricas de precisión de clasificación binaria cuantifican los dos tipos de predicciones correctas y dos tipos de errores. Las métricas típicas son la precisión (ACC), la precisión, la recuperación y la tasa de falsos positivos F1-measure. Cada métrica mide otro aspecto del modelo predictivo. La exactitud (ACC) mide la fracción de predicciones correctas. La precisión mide la fracción de positivos reales entre los ejemplos que se prevén como positivos. El recuerdo mide cuántos positivos reales se predijeron como positivos. F1-measure es la media armónica de la precisión y el recuerdo.

AUC es otro tipo de métrica. Mide la capacidad del modelo de predecir una mayor puntuación para ejemplos positivos en comparación con ejemplos negativos. Dado que AUC es independiente del umbral seleccionado, puede obtener una sensación del rendimiento de predicción del modelo a partir de la métrica de AUC sin elegir un umbral.

En función del problema de su negocio, puede que le interese más un modelo que funcione bien para un subconjunto concreto de estas métricas. Por ejemplo, dos aplicaciones empresariales podrían tener requisitos muy diferentes para sus modelos de ML:

Una aplicación podría necesitar estar muy segura de que las predicciones positivas sean realmente positivas (alta precisión) y podría permitirse la clasificación incorrecta de algunos ejemplos positivos como negativos (recuperación moderada).
Otra aplicación podría necesitar predecir correctamente el mayor número de ejemplos positivos posible (recuperación elevada) y aceptaría que algunos ejemplos negativos se clasifiquen incorrectamente como positivos (precisión moderada).

En Amazon ML, las observaciones obtienen una puntuación predicha en el rango [0,1]. El umbral de puntuación para tomar la decisión de clasificar ejemplos como 0 o 1 se establece de forma predeterminada en 0,5. Amazon ML permite revisar las implicaciones de elegir umbrales de puntuación diferentes y permite elegir un umbral adecuado que se ajuste a sus necesidades empresariales.

Aviso JavaScript está desactivado o no está disponible en su navegador.

Para utilizar la documentación de AWS, debe estar habilitado JavaScript. Para obtener más información, consulte las páginas de ayuda de su navegador.

Convenciones del documento

Evaluación de la precisión del modelo

Clasificación multiclase