資料字符化 - Amazon Redshift

本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。

資料字符化

字符化是出於資料安全目的,用不透明值替換實際值的程序。對安全敏感的應用程式會使用字符化,以字符替換敏感資料 (例如,個人身分識別資訊 (PII) 或受保護的醫療資訊 (PHI)) 來降低安全風險。去字符化會為授權使用者使用適當的安全政策將字符逆轉為實際值。

若要與第三方字符化服務整合,您可以使用您透過 AWS Lambda 建立的 Amazon Redshift 使用者定義函數 (UDF)。如需詳細資訊,請參閱《Amazon Redshift 資料庫開發人員指南》中的 Lambda 使用者定義的函數。例如,請參閱 Protegrity

Amazon Redshift 會將字符化請求傳送至透過 REST API 或預先定義的端點所存取的字符化伺服器。有兩個以上免費的 Lambda 函數會處理字符化和去字符化請求。對於此處理,您可以使用第三方字符化提供者所提供的 Lambda 函數。您也可以使用在 Amazon Redshift 中註冊為 Lambda UDF 的 Lambda 函數。

例如,假設您提交的查詢會在資料欄叫用字符化或去字符化 UDF。Amazon Redshift 叢集會對適用的引數資料列進行多工緩衝處理,並以批次方式將這些資料列平行傳送至 Lambda 函數。資料會在 Amazon Redshift 運算節點與 Lambda 之間另外以用戶端無法存取的隔離網路連線進行傳輸。Lambda 函數會將資料傳遞至字符化伺服器端點。字符化伺服器會根據需要對資料進行字符化或去字符化,並將其傳回。然後,Lambda 函數會將結果傳輸到 Amazon Redshift 叢集以進行進一步處理 (如有必要),然後傳回查詢結果。