Uso de Agregar para realizar cálculos resumidos en campos seleccionados - AWS Glue

Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.

Uso de Agregar para realizar cálculos resumidos en campos seleccionados

Para utilizar la transformación agregada
  1. Agregue el nodo agregado al diagrama de trabajos.

  2. En la pestaña Node properties (Propiedades del nodo), elija los campos para agruparlos al seleccionar el campo desplegable (opcional). Puede seleccionar más de un campo a la vez o buscar un nombre de campo al escribir en la barra de búsqueda.

    Cuando se seleccionan los campos, se muestran el nombre y el tipo de datos. Para eliminar un campo, seleccione ‘X’.

    La captura de pantalla muestra la pestaña Transform (Transformar) para el nodo agregado.
  3. Elija Aggregate another column (Agregar otra columna). Es necesario seleccionar al menos un campo.

    La captura de pantalla muestra los campos al elegir agregar otra columna.
  4. Elija un campo en el Field to aggretate (Campo a agregar) desplegable.

  5. Elija la función de agregación que desea aplicar al campo elegido:

    • avg: calcula el promedio

    • countDistinct: calcula el número de valores únicos no nulos

    • count: calcula el número de valores no nulos

    • first: devuelve el primer valor que satisface los criterios “agrupar por”

    • last: devuelve el último valor que satisface los criterios “agrupar por”

    • kurtosis: calcula la nitidez del pico de una curva de distribución de frecuencias

    • max: devuelve el valor más alto que satisface los criterios “agrupar por”

    • min: devuelve el valor más bajo que satisface los criterios “agrupar por”

    • sesgo: medida de la asimetría de la distribución de probabilidad de una distribución normal

    • stddev_pop: calcula la desviación estándar de la población y devuelve la raíz cuadrada de la variación de la población

    • sum: la suma de todos los valores en el grupo

    • sumDistinct: la suma de distintos valores en el grupo

    • var_samp: la variación de la muestra del grupo (ignora los valores nulos)

    • var_pop: la variación de la población del grupo (ignora los valores nulos)