Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.
IpToInt kelas
IpToInt
Transformasi mengubah nilai Internet Protocol versi 4 (IPv4) dari kolom sumber atau nilai lainnya ke nilai integer yang sesuai di kolom target, dan mengembalikan hasilnya di kolom baru.
Contoh
Untuk AWS Glue 4.0 dan yang lebih baru, buat atau perbarui argumen pekerjaan dengan key: --enable-glue-di-transforms, value: true
from pyspark.context import SparkContext from awsgluedi.transforms import * sc = SparkContext() input_df = spark.createDataFrame( [ ("192.0.0.1",), ("10.10.10.10",), ("1.2.3.4",), ("1.2.3.6",), ("http://12.13.14.15",), ("https://16.17.18.19",), ("1.2.3.4",), (None,), ("abc",), ("abc.abc.abc.abc",), ("321.123.123.123",), ("244.4.4.4",), ("255.255.255.255",), ], ["source_column_ip"], ) df_output = web_functions.IpToInt.apply( data_frame=input_df, spark_context=sc, source_column="source_column_ip", target_column="target_column", value=None ) df_output.show()
Output
Outputnya akan menjadi:
``` +----------------+---------------+ |source_column_ip| target_column| +----------------+---------------+ | 192.0.0.1| 3221225473| | 10.10.10.10| 168427722| | 1.2.3.4| 16909060| | 1.2.3.6| 16909062| |http://12.13.14.15| null| |https://16.17.18.19| null| | 1.2.3.4| 16909060| | null| null| | abc| null| |abc.abc.abc.abc| null| | 321.123.123.123| null| | 244.4.4.4| 4102444804| | 255.255.255.255| 4294967295| +----------------+---------------+ ```
IpToInt
Transformasi mengambil `source_column` sebagai `"source_column_ip"` dan `target_column` sebagai `"target_column"` dan mengubah string alamat IPv4 yang valid di kolom `source_column_ip` ke representasi bilangan bulat 32-bit yang sesuai dan menyimpan hasilnya di kolom `target_column`.
Untuk string alamat IPv4 yang valid (misalnya, “192.0.0.1", “10.10.10.10", “1.2.3.4"), transformasi berhasil mengubahnya menjadi representasi bilangan bulat mereka (misalnya, 3221225473, 168427722, 16909060). Untuk string yang bukan alamat IPv4 yang valid (misalnya, URL, string non-IP seperti “abc”, format IP tidak valid seperti “abc.abc.abc.abc”), nilai `target_column` disetel ke `null`. Untuk nilai `null` di kolom `source_column_ip`, nilai `target_column` juga diatur ke `null`.
Metode
__call__ (spark_context, data_frame, target_column, source_column=None, value=None)
IpToInt
Transformasi mengubah nilai Internet Protocol versi 4 (IPv4) dari kolom sumber atau nilai lainnya ke nilai integer yang sesuai di kolom target, dan mengembalikan hasilnya di kolom baru.
-
sourceColumn
— Nama kolom yang ada. -
value
— String karakter untuk dievaluasi. -
targetColumn
— Nama kolom baru yang akan dibuat.
apply(cls, *args, **kwargs)
Warisan dari GlueTransform
apply.
name(cls)
Warisan dari GlueTransform
nama.
describeArgs(cls)
Warisan dari GlueTransform
describeArgs.
describeReturn(cls)
Warisan dari GlueTransform
describeReturn.
describeTransform(cls)
Warisan dari GlueTransform
describeTransform.
describeErrors(cls)
Warisan dari GlueTransform
describeErrors.
describe(cls)
Warisan dari GlueTransform
describe.