A transformação IsEven
retorna um valor booleano em uma nova coluna que indica se a coluna ou o valor de origem é par. Se a coluna ou o valor de origem for decimal, o resultado será falso.
Exemplo
from pyspark.context import SparkContext
from pyspark.sql import SparkSession
from awsgluedi.transforms import *
sc = SparkContext()
spark = SparkSession(sc)
input_df = spark.createDataFrame(
[(5,), (0,), (-1,), (2,), (None,)],
["source_column"],
)
try:
df_output = math_functions.IsEven.apply(
data_frame=input_df,
spark_context=sc,
source_column="source_column",
target_column="target_column",
value=None,
true_string="Even",
false_string="Not even",
)
df_output.show()
except:
print("Unexpected Error happened ")
raise
Saída
A saída será:
```
+------------+------------+
|source_column|target_column|
+------------+------------+
| 5| Not even|
| 0| Even|
| -1| Not even|
| 2| Even|
| null| null|
+------------+------------+
```
A transformação IsEven
usa a "source_column" como "source_column" e a "target_column" como "target_column". Ela verifica se o valor na `"source_column"` é par ou não. Se o valor for par, ela define o valor `"target_column"` como “true_string” “Par”. Se o valor for ímpar, ela define o valor `"target_column"` como "false_string" “Não é par”. Se o valor `"source_column"` for "null", o valor `"target_column"` será definido como "null".
A transformação identifica corretamente os números pares (0 e 2) e define o valor `"target_column"` como “Par”. Para números ímpares (5 e -1), define o valor `"target_column"` como "Não é par". Para o valor "null" na `"source_column"`, o valor `"target_column"` é definido como "null".
Métodos
__call__(spark_context, data_frame, target_column, source_column=None, true_string=DEFAULT_TRUE_STRING, false_string=DEFAULT_FALSE_STRING, value=None)
A transformação IsEven
retorna um valor booleano em uma nova coluna que indica se a coluna ou o valor de origem é par. Se a coluna ou o valor de origem for decimal, o resultado será falso.
-
source_column
: o nome de uma coluna existente. -
target_column
: o nome da nova coluna a ser criada. -
true_string
: uma string que indica se o valor é par. -
false_string
: uma string que indica se o valor não é par.
apply(cls, *args, **kwargs)
Herdado de GlueTransform
apply.
name(cls)
Herdado de GlueTransform
name.
describeArgs(cls)
Herdado de GlueTransform
describeArgs.
describeReturn(cls)
Herdado de GlueTransform
describeReturn.
describeTransform(cls)
Herdado de GlueTransform
describeTransform.
describeErrors(cls)
Herdado de GlueTransform
describeErrors.
describe(cls)
Herdado de GlueTransform
describe.