Verwenden von Aggregate zum Durchführen zusammenfassender Berechnungen für ausgewählte Felder - AWS Glue

Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.

Verwenden von Aggregate zum Durchführen zusammenfassender Berechnungen für ausgewählte Felder

Verwenden der Aggregate-Transformation
  1. Fügen Sie den Aggregate-Knoten zum Auftragsdiagramm hinzu.

  2. Wählen Sie in der Registerkarte Node properties (Knoteneigenschaften) die Felder aus, die gruppiert werden sollen, indem Sie das Dropdown-Feld auswählen (optional). Sie können mehrere Felder gleichzeitig auswählen oder nach einem Feldnamen suchen, indem Sie die Suchleiste verwenden.

    Wenn Felder ausgewählt sind, werden Name und Datentyp angezeigt. Wählen Sie im Feld „X“, um ein Feld zu entfernen.

    Der Screenshot zeigt die Registerkarte „Transformieren“ für den Aggregate-Knoten.
  3. Klicken Sie auf Aggregate another column (Weitere Spalte aggregieren). Es ist erforderlich, mindestens ein Feld auszuwählen.

    Der Screenshot zeigt die Felder, wenn Sie „Aggregate another column“ (eine andere Spalte aggregieren) wählen.
  4. Wählen Sie ein Feld im Dropdown-Menü Field to aggregate (Zu aggregierendes Feld).

  5. Wählen Sie die Aggregationsfunktion aus, die auf das ausgewählte Feld angewendet werden soll:

    • avg - berechnet den Durchschnitt

    • countDistinct - berechnet die Anzahl der eindeutigen Nicht-Null-Werte

    • count - berechnet die Anzahl der Nicht-Null-Werte

    • first - gibt den ersten Wert zurück, der die Kriterien „Gruppieren nach“ erfüllt

    • last - gibt den letzten Wert zurück, der die Kriterien „Gruppieren nach“ erfüllt

    • kurtosis - berechnet die Schärfe des Peaks einer Frequenzverteilungskurve

    • max - gibt den höchsten Wert zurück, der die Kriterien „Gruppieren nach“ erfüllt

    • min - gibt den niedrigsten Wert zurück, der die Kriterien „Gruppieren nach“ erfüllt

    • Skewness - Maß für die Asymmetrie der Wahrscheinlichkeitsverteilung einer Normalverteilung

    • stddev_pop - berechnet die Standardabweichung der Bevölkerung und gibt die Quadratwurzel der Populationsvarianz zurück

    • sum - Die Summe aller Werte in der Gruppe

    • sumDistinct - Die Summe aller unterschiedlichen Werte in der Gruppe

    • var_samp - die Stichprobenvarianz der Gruppe (ignoriert Nullen)

    • var_pop - die Bevölkerungsvarianz der Gruppe (ignoriert Nullen)