기계 번역으로 제공되는 번역입니다. 제공된 번역과 원본 영어의 내용이 상충하는 경우에는 영어 버전이 우선합니다.
CryptographicHash 수업
CryptographicHash
변환은 열의 해시 값에 알고리즘을 적용합니다.
예
from pyspark.context import SparkContext from pyspark.sql import SparkSession from awsgluedi.transforms import * secret = "${SECRET}" sc = SparkContext() spark = SparkSession(sc) input_df = spark.createDataFrame( [ (1, "1234560000"), (2, "1234560001"), (3, "1234560002"), (4, "1234560003"), (5, "1234560004"), (6, "1234560005"), (7, "1234560006"), (8, "1234560007"), (9, "1234560008"), (10, "1234560009"), ], ["id", "phone"], ) try: df_output = pii.CryptographicHash.apply( data_frame=input_df, spark_context=sc, source_columns=["id", "phone"], secret_id=secret, algorithm="HMAC_SHA256", output_format="BASE64", ) df_output.show() except: print("Unexpected Error happened ") raise
출력
출력은 다음과 같습니다.
``` +---+------------+-------------------+-------------------+ | id| phone | id_hashed | phone_hashed | +---+------------+-------------------+-------------------+ | 1| 1234560000 | QUI1zXTJiXmfIb... | juDBAmiRnnO3g... | | 2| 1234560001 | ZAUWiZ3dVTzCo... | vC8lgUqBVDMNQ... | | 3| 1234560002 | ZP4VvZWkqYifu... | Kl3QAkgswYpzB... | | 4| 1234560003 | 3u8vO3wQ8EQfj... | CPBzK1P8PZZkV... | | 5| 1234560004 | eWkQJk4zAOIzx... | aLf7+mHcXqbLs... | | 6| 1234560005 | xtI9fZCJZCvsa... | dy2DFgdYWmr0p... | | 7| 1234560006 | iW9hew7jnHuOf... | wwfGMCOEv6oOv... | | 8| 1234560007 | H9V1pqvgkFhfS... | g9WKhagIXy9ht... | | 9| 1234560008 | xDhEuHaxAUbU5... | b3uQLKPY+Q5vU... | | 10| 1234560009 | GRN6nFXkxk349... | VJdsKt8VbxBbt... | +---+------------+-------------------+-------------------+ ```
변환은 지정된 알고리즘과 비밀 키를 사용하여 `id` 및 `phone` 열에 있는 값의 암호화 해시를 계산하고 해시를 Base64 형식으로 인코딩합니다. 결과 `df_output`에는 원래 `input_df`의 모든 열과 계산된 해시가 DataFrame 포함된 추가 `id_hashed` 및 `phone_hashed` 열이 포함됩니다. DataFrame
메서드
__call__ (스파크_컨텍스트, 데이터_프레임, 소스_컬럼, 비밀_id, 알고리즘=없음, 비밀_버전=없음, Create_Secret_IF_Missing=false, 출력_형식=없음, entity_type_filter=없음)
변환은 열의 해시 값에 알고리즘을 적용합니다. CryptographicHash
-
source_columns
— 기존 열로 구성된 배열. -
secret_id
— 시크릿 매니저 시크릿 키의 ARN 해시 기반 메시지 인증 코드 (HMAC) 접두사 알고리즘에서 소스 열을 해시하는 데 사용되는 키입니다. -
secret_version
– 선택 사항입니다. 기본값은 최신 시크릿 버전입니다. -
entity_type_filter
— 엔티티 유형의 선택적 배열. 감지된 PII만 자유 텍스트 열에서 암호화하는 데 사용할 수 있습니다. -
create_secret_if_missing
— 선택적 부울. true인 경우 호출자를 대신하여 시크릿 생성을 시도합니다. -
algorithm
— 데이터를 해시하는 데 사용되는 알고리즘. 유효한 열거형 값: MD5, SHA1, SHA256, SHA512, HMAC_MD5, HMAC_SHA1, HMAC_SHA256, HMAC_SHA512
apply(cls, *args, **kwargs)
GlueTransform
apply에서 상속됩니다.
name(cls)
GlueTransform
이름에서 상속됩니다.
describeArgs(cls)
GlueTransform
describeArgs에서 상속됩니다.
describeReturn(cls)
GlueTransform
describeReturn에서 상속됩니다.
describeTransform(cls)
GlueTransform
describeTransform에서 상속됩니다.
describeErrors(cls)
GlueTransform
describeErrors에서 상속됩니다.
describe(cls)
GlueTransform
describe에서 상속됩니다.