IsEven 수업 - AWS Glue

IsEven 수업

IsEven변환은 소스 열 또는 값이 짝수인지 여부를 나타내는 부울 값을 새 열에 반환합니다. 소스 열 또는 값이 10진수인 경우 결과는 false입니다.

from pyspark.context import SparkContext from pyspark.sql import SparkSession from awsgluedi.transforms import * sc = SparkContext() spark = SparkSession(sc) input_df = spark.createDataFrame( [(5,), (0,), (-1,), (2,), (None,)], ["source_column"], ) try: df_output = math_functions.IsEven.apply( data_frame=input_df, spark_context=sc, source_column="source_column", target_column="target_column", value=None, true_string="Even", false_string="Not even", ) df_output.show() except: print("Unexpected Error happened ") raise

출력

출력은 다음과 같습니다.

``` +------------+------------+ |source_column|target_column| +------------+------------+ | 5| Not even| | 0| Even| | -1| Not even| | 2| Even| | null| null| +------------+------------+ ```

IsEven변환은 `소스_열'을 “소스_열”로, `대상_열`은 “대상_열”로 취합니다. `"소스_컬럼""의 값이 짝수인지 아닌지를 확인합니다. 값이 짝수이면 `"대상_열 ”`값을 `true_string` “짝수”로 설정합니다. 값이 홀수이면 `"대상_열 ”`값을 `false_string` “짝수 아님”으로 설정합니다. `"소스_컬럼"` 값이 `null`인 경우, `"타겟_컬럼"` 값은 `null`로 설정됩니다.

변환은 짝수 (0과 2) 를 올바르게 식별하고 `"target_column"` 값을 “짝수”로 설정합니다. 홀수 (5와 -1) 의 경우 `"target_column"` 값을 “짝수 아님”으로 설정합니다. `"소스_컬럼"에 있는 `null` 값의 경우, `"타겟_컬럼"` 값은 `null`로 설정됩니다.

메서드

__call__ (스파크_컨텍스트, 데이터_프레임, 대상_열, 소스_컬럼=없음, 트루_문자열=기본값_트루_문자열, 거짓_문자열=기본값_거짓_문자열, 값=없음)

IsEven변환은 소스 열 또는 값이 짝수인지 여부를 나타내는 부울 값을 새 열에 반환합니다. 소스 열 또는 값이 10진수인 경우 결과는 false입니다.

  • source_column – 기존 열의 이름입니다.

  • target_column— 생성할 새 열의 이름.

  • true_string— 값이 짝수인지 여부를 나타내는 문자열.

  • false_string— 값이 짝수가 아닌지 여부를 나타내는 문자열입니다.

apply(cls, *args, **kwargs)

GlueTransform apply에서 상속됩니다.

name(cls)

GlueTransform 이름에서 상속됩니다.

describeArgs(cls)

GlueTransform describeArgs에서 상속됩니다.

describeReturn(cls)

GlueTransform describeReturn에서 상속됩니다.

describeTransform(cls)

GlueTransform describeTransform에서 상속됩니다.

describeErrors(cls)

GlueTransform describeErrors에서 상속됩니다.

describe(cls)

GlueTransform describe에서 상속됩니다.