Ejemplo Salida — métodos —__call__apply name describeArgs describeReturn describeTransform describeErrors describe

Clase FormatCase

La transformación FormatCase cambia cada cadena de una columna al tipo de mayúsculas y minúsculas especificado.

Ejemplo


from pyspark.context import SparkContext
from pyspark.sql import SparkSession
from awsgluedi.transforms import *

sc = SparkContext()
spark = SparkSession(sc)

datasource1 = spark.read.json("s3://${BUCKET}/json/zips/raw/data")

try:
    df_output = data_cleaning.FormatCase.apply(
        data_frame=datasource1,
        spark_context=sc,
        source_column="city",
        case_type="LOWER"
    )    
except:
    print("Unexpected Error happened ")
    raise

Salida

La transformación FormatCase convertirá los valores de la columna `city` a minúsculas según el parámetro `case_type="LOWER"`. El elemento DataFrame `df_output` resultante contendrá todas las columnas de la `datasource1` original, pero con los valores de la columna `city` en minúsculas.

call(spark_context, data_frame, source_column, case_type)

La transformación FormatCase cambia cada cadena de una columna al tipo de mayúsculas y minúsculas especificado.

source_column: el nombre de una columna existente.
case_type: los tipos de mayúsculas y minúsculas admitidos son CAPITAL, LOWER, UPPER, SENTENCE.

apply(cls, *args, **kwargs)

Heredado de GlueTransform apply.

name(cls)

Heredado de GlueTransform name.

describeArgs(cls)

Heredado de GlueTransform describeArgs.

describeReturn(cls)

Heredado de GlueTransform describeReturn.

describeTransform(cls)

Heredado de GlueTransform describeTransform.

describeErrors(cls)

Heredado de GlueTransform describeErrors.

describe(cls)

Heredado de GlueTransform describe.

Aviso JavaScript está desactivado o no está disponible en su navegador.

Para utilizar la documentación de AWS, debe estar habilitado JavaScript. Para obtener más información, consulte las páginas de ayuda de su navegador.

Convenciones del documento

FormatPhoneNumber

FillWithMode