Conceptos relativos a la detección de anomalías o valores atípicos - Amazon QuickSight

Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.

Conceptos relativos a la detección de anomalías o valores atípicos

Amazon QuickSight usa la palabra anomalía para describir los puntos de datos que quedan fuera de un patrón general de distribución. Hay muchos otros términos que se refieren a las anomalías, que es un término científico, tales como valores atípicos, desviaciones, rarezas, excepciones, irregularidades o peculiaridades, entre otros. El término utilizado puede basarse en el tipo de análisis que se lleva a cabo, en el tipo de datos que se utiliza o, incluso, en las preferencias del grupo. Estos puntos de datos atípicos representan una entidad (una persona, un lugar, un objeto o un momento) que es excepcional de alguna manera.

Los seres humanos reconocemos fácilmente los patrones y detectamos los elementos que no son como los demás. Nuestros sentidos nos proporcionan esta información. Si el patrón es simple y la cantidad de datos es reducida, se puede trazar fácilmente un gráfico para resaltar los valores atípicos presentes en los datos. A continuación citamos algunos ejemplos sencillos:

  • Un globo rojo en un grupo de globos azules

  • Un caballo de carreras que está muy por delante de los demás

  • Un niño que no está prestando atención durante la clase

  • Un día en que los pedidos en línea han subido pero los envíos han bajado

  • Una persona que se ha curado entre varias que no

Algunos puntos de datos representan un hecho significativo y otros representan un suceso aleatorio. El análisis revela qué datos merece la pena investigar, en función de los factores que han contribuido al hecho (factores clave). Las preguntas son esenciales para el análisis de datos. ¿Por qué ha sucedido? ¿Con qué está relacionado? ¿Ha ocurrido una sola vez o muchas? ¿Qué se puede hacer para fomentar o evitar que se produzcan casos iguales?

Comprender cómo y por qué se produce una variación, así como si existe algún un patrón en las variaciones, requiere más reflexión. Sin la ayuda del machine learning, cada persona puede llegar a una conclusión diferente, porque tienen diferentes experiencias e información. Por lo tanto, cada persona podría tomar una decisión de negocio ligeramente diferente. Si hay muchos datos o variables que tener en cuenta, el esfuerzo de análisis puede ser abrumador.

La detección de anomalías basada en ML identifica las causas y las correlaciones que permiten tomar decisiones basadas en datos. Usted controla la definición de cómo desea efectuar el trabajo con los datos. Puede especificar sus propios parámetros y elegir opciones adicionales, tales como identificar los factores clave en un análisis de contribuciones. Si lo prefiere, puede utilizar la configuración predeterminada. La siguiente sección le guía a lo largo del proceso de configuración y proporciona explicaciones sobre las opciones disponibles.