提取值 - AWS Glue DataBrew

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

提取值

使用从用户指定的路径中提取的值创建新列。如果源列是 Map、Array 或 Struct 类型,则应使用反勾号对路径中的每个字段进行转义(例如,`name`)。

参数
  • targetColumn-目标列的名称。

  • sourceColumn— 要从中提取值的源列的名称。

  • path— 用户要提取的特定密钥的路径。如果源列是 Map、Array 或 Struct 类型,则应使用反勾号对路径中的每个字段进行转义(例如,`name`)。

    考虑以下用户信息示例:

    user { name: “Ammy” address: { state: "CA", zipcode: 12345 }, phoneNumber:{"home": "123123123", "work": "456456456"} citizenship: ["Canada", "USA", "Mexico", "India"] }

    以下是您将提供的路径示例,具体取决于源列的类型:

    • 如果源列的类型为地图,则提取家庭电话号码的路径为:

      `user`.`phoneNumber`.`home`

    • 如果源列属于数组类型,则提取第二个 “公民身份” 值的路径为:

      `user`.`citizenship`[1]

    • 如果源列的类型为 struct,则提取邮政编码的路径为:

      `user`.`address`.`zipcode`

例 示例

{ "RecipeAction": { "Operation": "EXTRACT_VALUE", "Parameters": { "sourceColumn": "age", "targetColumn": "columnName", "path": "`age`.`name`", } } }