Clase Join - AWS Glue

Clase Join

Realiza una unión de igualdad en dos DynamicFrames.

Methods

__call__(frame1, frame2, keys1, keys2, transformation_ctx = "")

Realiza una unión de igualdad en dos DynamicFrames.

  • frame1: primer DynamicFrame que debe unirse (obligatorio).

  • frame2: segundo DynamicFrame que debe unirse (obligatorio).

  • keys1: claves que deben unirse en la primera trama (obligatorio).

  • keys2: claves que deben unirse en la segunda trama (obligatorio).

  • transformation_ctx: cadena única que se utiliza para identificar la información del estado (opcional).

Devuelve un elemento DynamicFrame nuevo que se obtiene uniendo los dos DynamicFrames.

apply(cls, *args, **kwargs)

Heredado de GlueTransform apply

name(cls)

Heredado de GlueTransform name

describeArgs(cls)

Heredado de GlueTransform describeArgs

describeReturn(cls)

Heredado de GlueTransform describeReturn

describeTransform(cls)

Heredado de GlueTransform describeTransform

describeErrors(cls)

Heredado de GlueTransform describeErrors

describe(cls)

Heredado de GlueTransform describe

Ejemplo de Join

La función Join administra columnas duplicadas. Cada conjunto de datos tiene una columna denominada zip. AWS Glueagrega un punto (.) a uno de los nombres de columna duplicados para evitar errores.

dyf_join = Join.apply(dyf_json, dyf_selectFields, 'zip', 'zip') dyf_join.toDF().show() +--------------------+-----+-----+ | customers| .zip| zip| +--------------------+-----+-----+ |[[108 Park Street...|75091|75091| |[[66 P Street, NY...|75023|75023| |[[708 Fed Ln, CA,...|90093|90093| +--------------------+-----+-----+