FormatCase kelas - AWS Glue

Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.

FormatCase kelas

FormatCaseTransformasi mengubah setiap string dalam kolom ke jenis kasus yang ditentukan.

Contoh

from pyspark.context import SparkContext from pyspark.sql import SparkSession from awsgluedi.transforms import * sc = SparkContext() spark = SparkSession(sc) datasource1 = spark.read.json("s3://${BUCKET}/json/zips/raw/data") try: df_output = data_cleaning.FormatCase.apply( data_frame=datasource1, spark_context=sc, source_column="city", case_type="LOWER" ) except: print("Unexpected Error happened ") raise

Output

FormatCaseTransformasi akan mengubah nilai di kolom `city` menjadi huruf kecil berdasarkan parameter `case_type="lower"`. Hasil `df_output` DataFrame akan berisi semua kolom dari `datasource1` asli, tetapi dengan nilai kolom DataFrame `city` dalam huruf kecil.

Metode

__call__ (spark_context, data_frame, source_column, case_type)

FormatCaseTransformasi mengubah setiap string dalam kolom ke jenis kasus yang ditentukan.

  • source_column— Nama kolom yang ada.

  • case_type— Jenis kasus yang didukung adalahCAPITAL,LOWER,UPPER,SENTENCE.

apply(cls, *args, **kwargs)

Warisan dari GlueTransform apply.

name(cls)

Warisan dari GlueTransform nama.

describeArgs(cls)

Warisan dari GlueTransform describeArgs.

describeReturn(cls)

Warisan dari GlueTransform describeReturn.

describeTransform(cls)

Warisan dari GlueTransform describeTransform.

describeErrors(cls)

Warisan dari GlueTransform describeErrors.

describe(cls)

Warisan dari GlueTransform describe.