FormatCase クラス - AWS Glue

FormatCase クラス

FormatCase 変換は、列の各文字列を指定されたケースタイプに変更します。

from pyspark.context import SparkContext from pyspark.sql import SparkSession from awsgluedi.transforms import * sc = SparkContext() spark = SparkSession(sc) datasource1 = spark.read.json("s3://${BUCKET}/json/zips/raw/data") try: df_output = data_cleaning.FormatCase.apply( data_frame=datasource1, spark_context=sc, source_column="city", case_type="LOWER" ) except: print("Unexpected Error happened ") raise

出力

FormatCase 変換は、「city」列の値を「case_type=LOWER」パラメータに基づいて小文字に変換します。結果の DataFrame 「df_output」には、元の「datasource1」のすべての列が含まれますが DataFrame、「city」列の値は小文字になります。

方法

__call__(spark_context、data_frame、source_column、case_type)

FormatCase 変換は、列の各文字列を指定されたケースタイプに変更します。

  • source_column - 既存の列の名前。

  • case_type – サポートされているケースタイプはCAPITAL、、LOWERUPPER、 ですSENTENCE

apply(cls, *args, **kwargs)

継承元は GlueTransform apply

name(cls)

継承元は GlueTransform name

describeArgs(cls)

継承元は GlueTransform describeArgs

describeReturn(cls)

継承元は GlueTransform describeReturn

describeTransform(cls)

継承元は GlueTransform describeTransform

describeErrors(cls)

継承元は GlueTransform describeErrors

describe(cls)

継承元は GlueTransform 説明