二值化 - AWS Glue DataBrew

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

二值化

获取选定数值源列中的所有值,将其与阈值进行比较,然后输出每行为 1 或 0 的新列。

参数
  • sourceColumn – 现有列的名称。

    targetColumn-要创建的新列的名称。

    threshold— 表示赋值 0 或 1 的阈值的数字。

    flip— 可以选择翻转二进制赋值,以便将较低的值赋为 1,将较高的值赋为 0。当 flip 参数为 true 时,小于或等于阈值的值会生成 1,大于阈值的值会生成 0。

例 示例

{ "Action": { "Operation": "BINARIZATION", "Parameters": { "sourceColumn": "level", "targetColumn": "bin", "threshold": "100.0", "flip": "false" } } }