本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。
IsEven 類別
IsEven
轉換會在新資料欄中傳回 Boolean 值,指出來源資料欄或值是否為偶數。如果來源資料行或值是十進位,則結果為 false。
範例
from pyspark.context import SparkContext from pyspark.sql import SparkSession from awsgluedi.transforms import * sc = SparkContext() spark = SparkSession(sc) input_df = spark.createDataFrame( [(5,), (0,), (-1,), (2,), (None,)], ["source_column"], ) try: df_output = math_functions.IsEven.apply( data_frame=input_df, spark_context=sc, source_column="source_column", target_column="target_column", value=None, true_string="Even", false_string="Not even", ) df_output.show() except: print("Unexpected Error happened ") raise
輸出
輸出將是:
``` +------------+------------+ |source_column|target_column| +------------+------------+ | 5| Not even| | 0| Even| | -1| Not even| | 2| Even| | null| null| +------------+------------+ ```
IsEven
轉換需要「源列」作為「源列」和「目標列」作為「目標列」。它會檢查「源 _ 列」中的值是否為偶數。如果該值是偶數,它將「目標列」值設置為「真實字符串」「偶數」。如果該值是奇數,它將「目標列」值設置為「假字符串」「不偶數」。如果「來源欄」值為「空」,則「目標欄」值會設定為「空值」。
轉換可正確識別偶數(0 和 2),並將「目標列」值設置為「偶數」。對於奇數(5 和 -1),它將「目標列」值設置為「不偶數」。對於「來源列」中的「空值」,「目標列」值設置為「空」。
方法
__call__(閃光上下文,數據框架,目標列,源列 = 無,真實字符串 = 默認 _ 真實 _ 字符串,假字符串 = 默認 _ 假字符串,值 = 無)
IsEven
轉換會在新資料欄中傳回 Boolean 值,指出來源資料欄或值是否為偶數。如果來源資料行或值是十進位,則結果為 false。
-
source_column
– 現有資料欄的名稱。 -
target_column
— 要建立的新欄名稱。 -
true_string
— 字串,指出值是否為偶數。 -
false_string
— 字串,指出值是否為偶數。
apply(cls, *args, **kwargs)
繼承自 GlueTransform
apply。
name(cls)
繼承自 GlueTransform
name。
describeArgs(cls)
繼承自 GlueTransform
describeArgs。
describeReturn(cls)
繼承自 GlueTransform
describeReturn。
describeTransform(cls)
繼承自 GlueTransform
describeTransform。
describeErrors(cls)
繼承自 GlueTransform
describeErrors。
describe(cls)
繼承自 GlueTransform
describe。