本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。
FormatPhoneNumber
轉換會傳回將電話號碼字串轉換為格式化值的資料欄。
範例
from pyspark.context import SparkContext
from pyspark.sql import SparkSession
from awsgluedi.transforms import *
sc = SparkContext()
spark = SparkSession(sc)
input_df = spark.createDataFrame(
[
("408-341-5669",),
("4083415669",)
],
["phone"],
)
try:
df_output = column_formatting.FormatPhoneNumber.apply(
data_frame=input_df,
spark_context=sc,
source_column="phone",
default_region="US"
)
df_output.show()
except:
print("Unexpected Error happened ")
raise
輸出
輸出將是:
```
+---------------+
| phone|
+---------------+
|(408) 341-5669|
|(408) 341-5669|
+---------------+
```
FormatPhoneNumber
轉換會將 `source_column` 視為 `"phone"`,而 `default_region` 視為 `"US"`。
無論電話號碼的初始格式為何,轉換都會成功將這兩個電話號碼格式化為標準美國格式 `(408) 341-5669`。
方法
__call__(spark_context, data_frame, source_column, phone_number_format=None, default_region=None, default_region_column=None)
FormatPhoneNumber
轉換會傳回將電話號碼字串轉換為格式化值的資料欄。
-
source_column
– 現有資料欄的名稱。 -
phone_number_format
– 要轉換電話號碼的格式。如果未指定格式,則預設為E.164
,這是國際認可的標準電話號碼格式。有效值包括以下項目:-
E164 (省略 E 之後的期間)
-
-
default_region
– 有效的區域碼,由兩個或三個大寫字母組成,當號碼本身中不存在國家/地區碼時,指定電話號碼的區域。最多defaultRegionColumn
可以提供defaultRegion
或 之一。 -
default_region_column
– 進階資料類型 的資料欄名稱Country
。當號碼本身中沒有國家/地區碼時,指定資料欄的區域碼會用來判斷電話號碼的國家/地區碼。最多defaultRegionColumn
可以提供defaultRegion
或 之一。
apply(cls, *args, **kwargs)
繼承自 GlueTransform
apply。
name(cls)
繼承自 GlueTransform
name。
describeArgs(cls)
繼承自 GlueTransform
describeArgs。
describeReturn(cls)
繼承自 GlueTransform
describeReturn。
describeTransform(cls)
繼承自 GlueTransform
describeTransform。
describeErrors(cls)
繼承自 GlueTransform
describeErrors。
describe(cls)
繼承自 GlueTransform
describe。