Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.
FormatCase clase
La FormatCase
transformación cambia cada cadena de una columna al tipo de mayúsculas y minúsculas especificado.
Ejemplo
from pyspark.context import SparkContext from pyspark.sql import SparkSession from awsgluedi.transforms import * sc = SparkContext() spark = SparkSession(sc) datasource1 = spark.read.json("s3://${BUCKET}/json/zips/raw/data") try: df_output = data_cleaning.FormatCase.apply( data_frame=datasource1, spark_context=sc, source_column="city", case_type="LOWER" ) except: print("Unexpected Error happened ") raise
Salida
La FormatCase
transformación convertirá los valores de la columna `city` a minúsculas según el parámetro `CASE_TYPE="lower"`. La opción `df_output` resultante DataFrame contendrá todas las columnas de la `datasource1` original, pero con los valores de la columna `city` en minúsculas. DataFrame
Métodos
__call__ (spark_context, data_frame, source_column, case_type)
La FormatCase
transformación cambia cada cadena de una columna al tipo de mayúsculas y minúsculas especificado.
-
source_column
: el nombre de una columna existente. -
case_type
— Los tipos de casos admitidos sonCAPITAL
LOWER
,UPPER
,,SENTENCE
.
apply(cls, *args, **kwargs)
Heredado de GlueTransform
apply.
name(cls)
Heredado de GlueTransform
name.
describeArgs(cls)
Heredado de GlueTransform
describeArgs.
describeReturn(cls)
Heredado de GlueTransform
describeReturn.
describeTransform(cls)
Heredado de GlueTransform
describeTransform.
describeErrors(cls)
Heredado de GlueTransform
describeErrors.
describe(cls)
Heredado de GlueTransform
describe.