SORT - AWS Glue DataBrew

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

SORT

按升序、降序或自定义顺序对数据集一列或多列中的数据进行排序。

参数
  • expressions— 包含一个或多个 JSON 编码字符串的字符串,表示排序表达式。

    • sourceColumn— 一个字符串,其中包含现有列的名称。

    • ordering— 排序可以是升序或降序。

    • nullsOrdering— 空值排序可以是 NULLS_TOP 或 NULLS_BOTTOM,以便在列的开头或底部放置空值或缺失值。

    • customOrder— 定义字符串排序的自定义顺序的字符串列表。默认情况下,字符串按字母顺序排序。

    • isCustomOrderCaseSensitive – 布尔值。默认值为 false

例 示例

{ "RecipeAction": { "Operation": "SORT", "Parameters": { "expressions": "[{\"sourceColumn\": \"A\", \"ordering\": \"ASCENDING\", \"nullsOrdering\": \"NULLS_TOP\"}]", } } }

例 自定义排序顺序示例

在以下示例中,CustomOrder 表达式字符串的格式为对象列表的格式。每个对象都描述了一列的排序表达式。

[ { "sourceColumn": "A", "ordering": "ASCENDING", "nullsOrdering": "NULLS_TOP", }, { "sourceColumn": "B", "ordering": "DESCENDING", "nullsOrdering": "NULLS_BOTTOM", "customOrder": ["Mon", "Tue", "Wed", "Thu", "Fri", "Sat", "Sun"], "isCustomOrderCaseSensitive": false, } ]