IpToInt kelas - AWS Glue

Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.

IpToInt kelas

IpToIntTransformasi mengubah nilai Internet Protocol versi 4 (IPv4) dari kolom sumber atau nilai lainnya ke nilai integer yang sesuai di kolom target, dan mengembalikan hasilnya di kolom baru.

Contoh

Untuk AWS Glue 4.0 dan yang lebih baru, buat atau perbarui argumen pekerjaan dengan key: --enable-glue-di-transforms, value: true

from pyspark.context import SparkContext from awsgluedi.transforms import * sc = SparkContext() input_df = spark.createDataFrame( [ ("192.0.0.1",), ("10.10.10.10",), ("1.2.3.4",), ("1.2.3.6",), ("http://12.13.14.15",), ("https://16.17.18.19",), ("1.2.3.4",), (None,), ("abc",), ("abc.abc.abc.abc",), ("321.123.123.123",), ("244.4.4.4",), ("255.255.255.255",), ], ["source_column_ip"], ) df_output = web_functions.IpToInt.apply( data_frame=input_df, spark_context=sc, source_column="source_column_ip", target_column="target_column", value=None ) df_output.show()

Output

Outputnya akan menjadi:

``` +----------------+---------------+ |source_column_ip| target_column| +----------------+---------------+ | 192.0.0.1| 3221225473| | 10.10.10.10| 168427722| | 1.2.3.4| 16909060| | 1.2.3.6| 16909062| |http://12.13.14.15| null| |https://16.17.18.19| null| | 1.2.3.4| 16909060| | null| null| | abc| null| |abc.abc.abc.abc| null| | 321.123.123.123| null| | 244.4.4.4| 4102444804| | 255.255.255.255| 4294967295| +----------------+---------------+ ```

IpToIntTransformasi mengambil `source_column` sebagai `"source_column_ip"` dan `target_column` sebagai `"target_column"` dan mengubah string alamat IPv4 yang valid di kolom `source_column_ip` ke representasi bilangan bulat 32-bit yang sesuai dan menyimpan hasilnya di kolom `target_column`.

Untuk string alamat IPv4 yang valid (misalnya, “192.0.0.1", “10.10.10.10", “1.2.3.4"), transformasi berhasil mengubahnya menjadi representasi bilangan bulat mereka (misalnya, 3221225473, 168427722, 16909060). Untuk string yang bukan alamat IPv4 yang valid (misalnya, URL, string non-IP seperti “abc”, format IP tidak valid seperti “abc.abc.abc.abc”), nilai `target_column` disetel ke `null`. Untuk nilai `null` di kolom `source_column_ip`, nilai `target_column` juga diatur ke `null`.

Metode

__call__ (spark_context, data_frame, target_column, source_column=None, value=None)

IpToIntTransformasi mengubah nilai Internet Protocol versi 4 (IPv4) dari kolom sumber atau nilai lainnya ke nilai integer yang sesuai di kolom target, dan mengembalikan hasilnya di kolom baru.

  • sourceColumn— Nama kolom yang ada.

  • value— String karakter untuk dievaluasi.

  • targetColumn— Nama kolom baru yang akan dibuat.

apply(cls, *args, **kwargs)

Warisan dari GlueTransform apply.

name(cls)

Warisan dari GlueTransform nama.

describeArgs(cls)

Warisan dari GlueTransform describeArgs.

describeReturn(cls)

Warisan dari GlueTransform describeReturn.

describeTransform(cls)

Warisan dari GlueTransform describeTransform.

describeErrors(cls)

Warisan dari GlueTransform describeErrors.

describe(cls)

Warisan dari GlueTransform describe.