配方步骤和功能参考 - AWS Glue DataBrew

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

配方步骤和功能参考

在本参考文献中,您可以找到配方步骤和函数的描述,您可以通过编程方式使用这些步骤和函数, AWS CLI 或者使用其中一个 AWS SDK。在中 DataBrew,配方步骤是一种将原始数据转换为可供数据管道使用的表单的操作。 DataBrew 函数是一种特殊的配方步骤,它根据参数执行计算。

用户界面中转换的类别包括以下几种:

  • 基本专栏配方步骤

    • 筛选条件

  • 数据清理配方步骤

    • 格式

    • 清除

    • Extract

  • 数据质量配方步骤

    • 缺失

    • 无效

    • 重复

    • 异常值

  • 个人身份信息(PII)配方步骤

    • 屏蔽个人信息

    • 替换个人信息

    • 加密个人信息

    • 随机排列行

  • 列结构配方步骤

    • Split

    • 合并

    • 创建

  • 列格式化配方步骤

    • DECIMAL

    • 千位分隔符

    • 缩写

  • 数据结构配方步骤

    • Nest-Unnest

    • Pivot

    • 联接

    • Union

  • 数据科学配方步骤

    • 文本

    • 比例

    • Mapping

    • 编码

  • 函数

    • 数学函数

    • 聚合函数

    • 文本函数

    • 日期和时间函数

    • 窗口函数

    • 网络函数

    • 其他函数

有关如何在配方中使用这些配方步骤和函数(包括条件表达式的使用)的更多信息,请参阅定义配方结构

以下各节描述了配方步骤和功能,按其作用进行组织。