使用聚合对选定字段执行汇总计算 - AWS Glue

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

使用聚合对选定字段执行汇总计算

要使用 Aggregate 转换
  1. 将 Aggregate 节点添加到任务图中。

  2. Node properties(节点属性)选项卡上,通过选择下拉字段,选择要组合在一起的字段(可选)。您可以一次选择多个字段,也可以在搜索栏中键入来搜索字段名称。

    选择字段后,将显示名称和数据类型。要删除字段,请在字段上选择“X”。

    
               屏幕截图显示了 Aggregate 节点的 Transform(转换)选项卡。
  3. 选择 Aggregate another column(聚合另一列)。至少需要选择一个字段。

    
               屏幕截图显示了选择 Aggregate another column(聚合另一列)时的字段。
  4. Field to aggregate(要聚合的字段)下拉列表中选择一个字段。

  5. 选择要应用于所选字段的聚合函数:

    • avg - 计算平均值

    • countDistinct - 计算唯一非空值的数量

    • count - 计算非空值的数量

    • first - 返回满足“group by”(分组依据)条件的第一个值

    • last - 返回满足“group by”(分组依据)条件的最后一个值

    • kurtosis - 计算频率分布曲线峰值的锐度

    • max - 返回满足“group by”(分组依据)条件的最高值

    • min - 返回满足“group by”(分组依据)条件的最低值

    • skewness - 衡量正态分布概率分布的不对称性

    • stddev_pop - 计算总体标准差并返回总体方差的平方根

    • sum - 组中所有值的总和。

    • sumDistinct - 组中不同值的总和。

    • var_samp - 组的样本方差(忽略空值)

    • var_pop - 组的总体方差(忽略空值)