教學課程:使用 S3 物件 Lambda 和 Amazon Comprehend 來偵測和編輯PII資料 - Amazon Simple Storage Service

本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。

教學課程:使用 S3 物件 Lambda 和 Amazon Comprehend 來偵測和編輯PII資料

當您將 Amazon S3 用於多個應用程式和使用者存取的共用資料集時,請務必將特權資訊 (例如個人識別資訊 (PII)) 限制為僅授權的實體。例如,當行銷應用程式使用某些包含的資料時PII,可能需要先遮罩PII資料以符合資料隱私權要求。此外,當分析應用程式使用生產訂單清查資料集時,可能需要先修訂客戶信用卡資訊,以防止意外的資料外洩。

使用 S3 物件 Lambda 和由 Amazon Comprehend 提供支援的預先建置 AWS Lambda 函數,您可以在將PII資料傳回至應用程式之前保護從 S3 擷取的資料。具體而言,您可以使用預先建置的 Lambda 函數做為修訂函數,並將其連接到 S3 Object Lambda 存取點。當應用程式 (例如,分析應用程式) 傳送標準 S3 GET 請求時,透過 S3 物件 Lambda 存取點發出的這些請求會叫用預先建立的編輯 Lambda 函數,以偵測並編輯透過支援的 S3 存取點從 S3 儲存貯體擷取的PII資料。然後,S3 Object Lambda 存取點會將修訂的結果傳回至應用程式。

這是 S3 Object Lambda 工作流程圖。

在此過程中,預先建立的 Lambda 函數會使用 Amazon Comprehend (一種自然語言處理 (NLP) 服務來擷取表示方式的變化,而不論文字中的PII存在程度為何 (例如數字或單字和數字的組合)。PIIAmazon Comprehend 甚至可以在文字中使用上下文來瞭解 4 位數數字是一個PIN、社會安全號碼 () 的最後四個數字 (SSN) 還是一年。Amazon Comprehend 會以 UTF -8 種格式處理任何文字檔案,並且可以在不影響準確性的情況下大規模保護PII。如需詳細資訊,請參閱《Amazon Comprehend 開發人員指南》中的什麼是 Amazon Comprehend?

目標

在本教學課程中,您將學習如何搭配使用 S3 Object Lambda 和預先建置的 Lambda 函數 ComprehendPiiRedactionS3ObjectLambda。此功能使用 Amazon Comprehend 來偵測PII實體。然後,它會以星號取代這些實體,進而予以修訂。通過編輯PII,您可以隱藏敏感數據,這有助於安全性和合規性。

您也會學到如何使用和設定中的預先建置 AWS Lambda 函數,AWS Serverless Application Repository以便與 S3 物件 Lambda 搭配使用,以便輕鬆部署。

先決條件:建立具有權限的IAM使用者

在開始本教學課程之前,您必須擁有可以使用正確權限的 AWS Identity and Access Management 使用者 (使用IAM者) 身分登入的 AWS 帳戶。

您可以為自學課程建立IAM使用者。若要完成此教學課程,您的IAM使用者必須附加下列IAM原則,才能存取相關 AWS 資源並執行特定動作。

注意

為了簡單起見,本自學課程會建立並使用使用IAM者。完成本教學課程後,請記得 刪除使IAM用者。對於正式作業使用,我們建議您遵循使用IAM者指南IAM中的安全性最佳做法。其中一項最佳實務是,要求人類使用者搭配身分提供者使用聯合功能,以便使用暫時性憑證存取 AWS 。另一個最佳做法是要求工作負載使用具有IAM角色的臨時登入資料來存取 AWS。若要瞭解如 AWS IAM Identity Center 何使用建立具有臨時登入資料的使用者,請參閱《使用AWS IAM Identity Center 者指南》中的入門

本教學課程也使用完整存取的政策。為供生產使用,我們建議您改為僅授予使用案例所需的最低許可,以符合安全最佳實務

您的IAM使用者需要下列 AWS 受管理的策略:

您可以在建立IAM使用者時直接附加這些現有策略。若要取得有關如何建立使用IAM者的詳細資訊,請參閱《使IAM用指南》中的〈建立使用IAM者 (主控台)

此外,您的IAM使用者還需要客戶管理政策。若要將所有 AWS Serverless Application Repository 資源和動作的權限授與IAM使用者,您必須建立IAM策略並將策略附加至使IAM用者。

若要建立IAM政策並將其附加至您的IAM使用者
  1. 登入 AWS Management Console 並開啟IAM主控台,位於https://console.aws.amazon.com/iam/

  2. 在左側導覽窗格中選擇 Policies (政策)。

  3. 選擇 建立政策

  4. Visual editor (視覺化編輯器) 索引標籤上,針對 Service (服務),選擇 Choose a service (選擇服務)。然後,選擇 Serverless Application Repository

  5. 針對 Actions (動作),在 Manual actions (手動動作) 下,為本教學課程選取 All Serverless Application Repository actions (serverlessrepo:*) (所有 Serverless Application Repository 動作 (serverlessrepo:*)。

    作為安全最佳實務,您應該根據您的使用案例,僅允許使用者需要的那些動作和資源的許可。如需詳細資訊,請參閱《IAM使用指南》IAM中的「安全性最佳作法」。

  6. 針對 Resources (資源),為本教學課程選擇 All resources (所有資源)。

    作為最佳實務,您應該僅為特定帳戶中的特定資源定義許可。或者,您也可以使用條件金鑰授予最低權限。如需詳細資訊,請參閱《IAM使用指南》中的「授予最少權限」

  7. 選擇下一步:標籤

  8. 選擇下一步:檢閱

  9. Review policy (檢閱政策) 頁面上,為您正在建立的政策輸入 Name (名稱) (例如,tutorial-serverless-application-repository) 與 Description (描述) (選用)。檢閱政策摘要以確認您已授予所需的許可,然後選擇 Create policy (建立政策) 來儲存您的新政策。

  10. 在左側導覽窗格中,選擇 Users (使用者)。然後,為本教學課程選擇IAM使用者。

  11. 在所選使用者的 Summary (摘要) 頁面上,選擇 Permissions (許可) 標籤,然後選擇 Add permissions (新增許可)。

  12. Grant permissions (授予許可) 下,選擇 Attach existing policies directly (直接連接現有政策)

  13. 選取您剛建立之政策旁的核取方塊 (例如,tutorial-serverless-application-repository),然後選擇 Next: Review (下一步:檢閱)。

  14. Permissions summary (許可摘要) 下,檢閱摘要以確認您已連接想要的政策。然後,選擇 Add permissions (新增許可)。

步驟 1:建立 S3 儲存貯體

建立儲存貯體來存放您計劃要轉換的原始資料。

建立儲存貯體
  1. 登入 AWS Management Console 並開啟 Amazon S3 主控台,位於https://console.aws.amazon.com/s3/

  2. 在左側導覽窗格中,選擇 Buckets (儲存貯體)。

  3. 選擇 Create bucket (建立儲存貯體)。

    Create bucket (建立儲存貯體) 頁面隨即開啟。

  4. 針對 Bucket name (儲存貯體名稱),輸入儲存貯體的名稱 (例如 tutorial-bucket)。

    如需有關在 Amazon S3 中的命名儲存貯體的詳細資訊,請參閱 儲存貯體命名規則

  5. 針對 Region (區域),選擇希望存放儲存貯體的 AWS 區域 。

    如需有關儲存貯體區域的詳細資訊,請參閱 儲存貯體概觀

  6. 針對 Block Public Access settings for this bucket (此儲存貯體的封鎖公開存取設定),將保留預設設定 (已啟用封鎖所有公開存取)。

    除非您需要針對使用案例關閉一或多個設定,否則建議您將所有封鎖公開存取設定保持啟用狀態。如需封鎖公開存取的詳細資訊,請參閱 封鎖對 Amazon S3 儲存體的公開存取權

  7. 對於其他設定,請保留預設值。

    (選用) 如果您想要為您的特定使用案例設定其他儲存貯體設定,請參閱 建立儲存貯體

  8. 選擇建立儲存貯體

步驟 2:將檔案上傳至 S3 儲存貯體

將包含各種類型的已知資PII料 (例如姓名、銀行資訊、電話號碼等) 的文字檔案上傳到 S3 儲存貯體SSNs,做為您將在本教學稍後編輯PII的原始資料。

例如,您可以上傳下列 tutorial.txt 檔案。這是 Amazon Comprehend 的輸入檔案範例。

Hello Zhang Wei, I am John. Your AnyCompany Financial Services, LLC credit card account 1111-0000-1111-0008 has a minimum payment of $24.53 that is due by July 31st. Based on your autopay settings, we will withdraw your payment on the due date from your bank account number XXXXXX1111 with the routing number XXXXX0000. Your latest statement was mailed to 100 Main Street, Any City, WA 98121. After your payment is received, you will receive a confirmation text message at 206-555-0100. If you have questions about your bill, AnyCompany Customer Service is available by phone at 206-555-0199 or email at support@anycompany.com.
上傳檔案至儲存貯體
  1. 登入 AWS Management Console 並開啟 Amazon S3 主控台,位於https://console.aws.amazon.com/s3/

  2. 在左側導覽窗格中,選擇 Buckets (儲存貯體)。

  3. Buckets (儲存貯體) 清單中,選擇您在步驟 1 中建立的且要將檔案上傳至的儲存貯體的名稱 (例如,tutorial-bucket)。

  4. 在儲存貯體的物件索引標籤上,選擇上傳

  5. Upload (上傳) 頁面上的 Files and folders (檔案和資料夾) 下,選擇 Add files (新增檔案)。

  6. 選擇要上傳的檔案,然後選擇 Open (開啟)。舉例而言,您可以上傳之前提及的 tutorial.txt 檔案範例。

  7. 選擇上傳

步驟 3:建立 S3 存取點

若要使用 S3 Object Lambda 存取點來存取和轉換原始資料,您必須建立 S3 存取點,並將其與您在步驟 1 中建立的 S3 儲存貯體建立關聯。存取點必須與您要轉換的物件位於相同 AWS 區域 的位置。

在本教學課程稍後的部分,您將使用此存取點做為您 Object Lambda 存取點的支援存取點。

建立存取點
  1. 登入 AWS Management Console 並開啟 Amazon S3 主控台,位於https://console.aws.amazon.com/s3/

  2. 在左側導覽窗格中,選擇 Access Points (存取點)。

  3. Access Points (存取點) 頁面上,選擇 Create access point (建立存取點)。

  4. Access point name (存取點名稱) 欄位中,輸入存取點的名稱 (例如,tutorial-pii-access-point)。

    如需存取點命名的詳細資訊,請參閱「命名 Amazon S3 存取點的規則」。

  5. Bucket name (儲存貯體名稱) 欄位,輸入您在步驟 1 中建立的儲存貯體的名稱 (例如,tutorial-bucket)。S3 將存取點連接至此儲存貯體。

    (選用) 您可以選擇 Browse S3 (瀏覽 S3) 來瀏覽並搜尋您帳戶中的儲存貯體。如果您選擇 Browse S3 (瀏覽 S3),請先選擇所需的儲存貯體,然後選擇 Choose path (選擇路徑),系統即會在 Bucket name (儲存貯體名稱) 欄位中填入該儲存貯體的名稱。

  6. 針對 Network origin (網路來源),選擇 Internet (網際網路)。

    如需存取點網路來源的詳細資訊,請參閱「建立受限於 Virtual Private Cloud 的存取點」。

  7. 依預設,存取點的所有封鎖公開存取設定都會開啟。我們建議您將封鎖所有公開存取保持啟用的狀態。如需詳細資訊,請參閱管理存取點的公開存取

  8. 對於所有其他存取點設定,保留預設設定。

    (選用) 您可以修改存取點設定,以支援您的使用案例。在本教學課程中,我們建議您保留預設設定。

    (選用) 如果您需要管理存取點的存取,您可以指定存取點政策。如需詳細資訊,請參閱存取點政策範例

  9. 選擇 Create access point (建立新的存取點)

步驟 4:設定及部署預先建置的 Lambda 函數

若要編輯PII資料,請設定和部署預先建置的 AWS Lambda 函ComprehendPiiRedactionS3ObjectLambda數,以搭配 S3 物件 Lambda 存取點使用。

設定和部署 Lambda 函數
  1. 登入 AWS Management Console 並檢視中的ComprehendPiiRedactionS3ObjectLambda函數 AWS Serverless Application Repository。

  2. 針對 Application settings (應用程式設定),在 Application name (應用程式名稱) 下,為本教學課程保留預設值 (ComprehendPiiRedactionS3ObjectLambda)。

    (選用) 您可以輸入您要給予此應用程式的名稱。如果您計劃針對相同共用資料集的不同存取需求,設定多個 Lambda 函數,您可能會想要這麼做。

  3. 對於 MaskCharacter,保留預設值 (*)。遮罩字元會取代密文PII實體中的每個字元。

  4. 對於 MaskMode,請保留預設值 (MASK)。MaskMode值會指定PII實體是使用MASK字元還是PII_ENTITY_TYPE值來編輯。

  5. 若要編輯指定類型的資料 PiiEntityTypes,請保留預設值ALLPiiEntityTypes值指定要考慮進行密文的PII圖元類型。

    如需有關支援PII實體類型清單的詳細資訊,請參閱 Amazon Comprehend 開發人員指南中的偵測個人識別資訊 (PII)

  6. 將其餘設定保持為預設值。

    (選用) 如果您想要為您的特定使用案例設定其他設定,請參閱位於頁面左側的 Readme 檔案

  7. 選取 [我確認此應用程式會建立自訂IAM角色] 旁邊的核取方塊。

  8. 選擇部署

  9. 在新應用程式的頁面,在 Resources (資源) 下,選擇您部署的 Lambda 函數的 Logical ID (邏輯 ID),以檢閱 Lambda function (Lambda 函數) 頁面上的函數。

步驟 5:建立 S3 Object Lambda 存取點

S3 物件 Lambda 存取點提供了直接從 S3 GET 請求叫用 Lambda 函數的彈性,以便函數可編寫從 S3 存取點擷取的PII資料。建立和設定 S3 物件 Lambda 存取點時,您必須指定要叫用的編輯 Lambda 函數,並以JSON格式提供事件內容作為自訂參數,供 Lambda 使用。

事件內容提供了從 S3 Object Lambda 傳遞給 Lambda 事件中提出之請求的相關資訊。如需事件內容中所有欄位的詳細資訊,請參閱 事件內容格式和用量

建立 S3 Object Lambda 存取點
  1. 登入 AWS Management Console 並開啟 Amazon S3 主控台,位於https://console.aws.amazon.com/s3/

  2. 在左側的導覽窗格中,選擇 Object Lambda Access Points (Object Lambda 存取點)。

  3. Object Lambda Access Points (Object Lambda 存取點) 頁面上,選擇 Create Object Lambda access point (建立 Object Lambda 存取點)。

  4. 對於 Object Lambda 存取點名稱,請輸入您要用於 Object Lambda 存取點的名稱 (例如,tutorial-pii-object-lambda-accesspoint)。

  5. 針對 Supporting Access Point (支援存取點),輸入或瀏覽您在步驟 3 中建立的標準存取點 (例如,tutorial-pii-access-point),然後選擇 Choose supporting Access Point (選擇支援存取點)。

  6. 對於 S3 APIs,若要從 S3 儲存貯體擷取物件以供 Lambda 函數處理,請選取GetObject

  7. 針對 Invoke Lambda function (叫用 Lambda 函數),您可以為本教學課程選擇以下兩個選項中的任意一個。

    • Lambda function (Lambda 函數) 下拉式清單,選擇 Choose from functions in your account (從您帳戶中的函數選擇),並選擇您在步驟 4 中部署的 Lambda 函數 (例如,serverlessrepo-ComprehendPiiRedactionS3ObjectLambda)。

    • 選擇輸入 ARN,然後輸入您在步驟 4 中建立的 Lambda 函數的 Amazon 資源名稱 (ARN)。

  8. 對於 Lambda 函數版本,請選擇 $ LATEST (您在步驟 4 中部署的 Lambda 函數的最新版本)。

  9. (選用) 如果您需要 Lambda 函數來辨識並處理具有範圍和零件編號標頭的GET請求,請選取 Lambda 函數支援使用範圍的請求Lambda 函數支援使用零件編號的請求。否則,請清除這兩個核取方塊。

    如需如何藉助 S3 Object Lambda 使用範圍或組件編號的詳細資訊,請參閱「使用 Range 和 partNumber 標頭」。

  10. (選擇性) 在裝載-用之下,新增JSON文字以提供 Lambda 函數其他資訊。

    承載是選用的JSON文字,您可以提供給 Lambda 函數,做為來自特定 S3 物件 Lambda 存取點之所有叫用的輸入。若要針對叫用相同 Lambda 函數的不同 Object Lambda 存取點自訂行為,您可以使用不同參數設定承載,藉此擴充 Lambda 函數的靈活性。

    如需承載的詳細資訊,請參閱「事件內容格式和用量」。

  11. (選用) 對於 請求指標 - 選用,請選擇停用啟用,將 Amazon S3 監控新增至您的 Object Lambda 存取點。請求指標以標準 Amazon 費 CloudWatch 率計費。如需詳細資訊,請參閱CloudWatch定價

  12. Object Lambda Access Point policy - optional (Object Lambda 存取點政策 - 選用) 下,請保留預設設定。

    (選用) 您可以設定資源政策。此資源政策授與使用指定物件 Lambda 存取點的GetObjectAPI權限。

  13. 將其餘設定保持為預設值,並選擇 Create Object Lambda Access Point (建立 Object Lambda 存取點)。

步驟 6:使用 S3 Object Lambda 存取點擷取已修訂的檔案

現在,S3 物件 Lambda 已準備就緒,可以編輯原始檔案中的PII資料。

若要使用 S3 Object Lambda 存取點擷取修訂的檔案

當您透過 S3 物件 Lambda 存取點請求擷取檔案時,您可以GetObjectAPI呼叫 S3 物件 Lambda。S3 物件 Lambda 會叫用 Lambda 函數來編輯您的PII資料,並傳回轉換後的資料做為對標準 S3 GetObject API 呼叫的回應。

  1. 登入 AWS Management Console 並開啟 Amazon S3 主控台,位於https://console.aws.amazon.com/s3/

  2. 在左側的導覽窗格中,選擇 Object Lambda Access Points (Object Lambda 存取點)。

  3. Object Lambda 存取點頁面上,選擇您在步驟 5 中建立的 S3 Object Lambda 存取點 (例如,tutorial-pii-object-lambda-accesspoint)。

  4. 在您的 S3 Object Lambda 存取點的物件標籤上,選取與您在 步驟 2. 中上傳至 S3 儲存貯體的檔案同名的檔案 (例如,tutorial.txt)。

    此檔案應包含所有轉換的資料。

  5. 若要檢視轉換的資料,選擇 Open (開啟) 或 Download (下載)。

    您應能夠看到已修訂的檔案,如下方範例所示。

    Hello *********. Your AnyCompany Financial Services, LLC credit card account ******************* has a minimum payment of $24.53 that is due by *********. Based on your autopay settings, we will withdraw your payment on the due date from your bank account ********** with the routing number *********. Your latest statement was mailed to **********************************. After your payment is received, you will receive a confirmation text message at ************. If you have questions about your bill, AnyCompany Customer Service is available by phone at ************ or email at **********************.

步驟 7:清除

如果您只是透過 S3 Object Lambda 編輯資料作為學習練習,請刪除您分配的 AWS 資源,以免再產生費用。

刪除 Object Lambda 存取點

  1. 登入 AWS Management Console 並開啟 Amazon S3 主控台,位於https://console.aws.amazon.com/s3/

  2. 在左側的導覽窗格中,選擇 Object Lambda Access Points (Object Lambda 存取點)。

  3. Object Lambda 存取點頁面上,選擇您在步驟 5 中建立的 S3 Object Lambda 存取點左側的選項按鈕 (例如,tutorial-pii-object-lambda-accesspoint)。

  4. 選擇 刪除

  5. 在出現的文字欄位中,輸入存取點名稱,以確認您要刪除 Object Lambda 存取點,然後選擇刪除

刪除 S3 存取點

  1. 登入 AWS Management Console 並開啟 Amazon S3 主控台,位於https://console.aws.amazon.com/s3/

  2. 在左側導覽窗格中,選擇 Access Points (存取點)。

  3. 導覽至您在步驟 3 中建立的存取點 (例如,tutorial-pii-access-point),然後選擇存取點名稱旁的選項按鈕。

  4. 選擇 刪除

  5. 在出現的文字欄位中,輸入存取點名稱,以確認您要刪除此存取點,然後選擇 Delete (刪除)。

刪除 Lambda 函數

  1. 在的 AWS Lambda 主控台中 https://console.aws.amazon.com/lambda/,選擇左側導覽窗格中的 [函數]。

  2. 選擇您在步驟 4 中建立的函數 (例如,serverlessrepo-ComprehendPiiRedactionS3ObjectLambda)。

  3. 選擇動作,然後選擇刪除

  4. Delete function (刪除函數) 對話方塊中,選擇 Delete (刪除)。

刪除記 CloudWatch錄群組

  1. 在開啟 CloudWatch 主控台https://console.aws.amazon.com/cloudwatch/

  2. 在左側導覽窗格中,選擇 Log groups (日誌群組)。

  3. 尋找您在步驟 4 中建立的且名稱以 Lambda 函數結尾的日誌群組 (例如,serverlessrepo-ComprehendPiiRedactionS3ObjectLambda)。

  4. 選擇 Actions (動作),然後選擇 Delete log group(s) (刪除日誌群組)。

  5. 刪除日誌群組 對話方塊中,選擇 刪除

刪除 S3 來源儲存貯體中的原始檔案

  1. 登入 AWS Management Console 並開啟 Amazon S3 主控台,位於https://console.aws.amazon.com/s3/

  2. 在左側導覽窗格中,選擇 Buckets (儲存貯體)。

  3. Bucket name (儲存貯體名稱) 清單中,選擇您在步驟 2 中將原始檔案上傳到的儲存貯體的名稱 (例如,tutorial-bucket)。

  4. 選取要刪除之物件名稱左側的核取方塊 (例如,tutorial.txt)。

  5. 選擇 刪除

  6. Delete objects (刪除物件) 頁面上的 Permanently delete objects? (永久刪除物件?) 區段中,在文字方塊中輸入 permanently delete,以確認您要刪除此物件。

  7. 選擇 Delete objects (刪除物件)。

刪除 S3 來源儲存貯體

  1. 登入 AWS Management Console 並開啟 Amazon S3 主控台,位於https://console.aws.amazon.com/s3/

  2. 在左側導覽窗格中,選擇 Buckets (儲存貯體)。

  3. Buckets (儲存貯體) 清單中,選擇您在步驟 1 中建立的儲存貯體名稱旁的選項按鈕 (例如,tutorial-bucket)。

  4. 選擇 刪除

  5. Delete bucket (刪除儲存貯體) 頁面上,在文字欄位中輸入儲存貯體名稱以確認您要刪除該儲存貯體,然後選擇 Delete bucket (刪除儲存貯體)。

刪除 Lambda 函數的IAM角色

  1. 登入 AWS Management Console 並開啟IAM主控台,位於https://console.aws.amazon.com/iam/

  2. 在左側導覽窗格中,選擇 Roles (角色),然後選取您要刪除之角色名稱旁的核取方塊。角色名稱以您在步驟 4 中部署的 Lambda 函數的名稱為開頭 (例如,serverlessrepo-ComprehendPiiRedactionS3ObjectLambda)。

  3. 選擇 刪除

  4. Delete (刪除) 對話方塊中,在文字輸入欄位中輸入角色名稱以確認刪除。再選擇 Delete (刪除)。

為您的IAM使用者刪除客戶管理政策

  1. 登入 AWS Management Console 並開啟IAM主控台,位於https://console.aws.amazon.com/iam/

  2. 在左側導覽窗格中選擇 Policies (政策)。

  3. Policies (政策) 頁面上,在搜尋方塊中輸入您在 Prerequisites (先決條件) 中建立的客戶受管政策的名稱 (例如,tutorial-serverless-application-repository),以篩選政策清單。選取您要刪除的政策名稱旁的選項按鈕。

  4. 選擇動作,然後選擇刪除

  5. 在顯示的文字欄位中,輸入本政策的名稱,以確認您要刪除此政策,然後選擇 Delete (刪除)。

刪除使IAM用者

  1. 登入 AWS Management Console 並開啟IAM主控台,位於https://console.aws.amazon.com/iam/

  2. 在左側導覽窗格中,選擇 Users (使用者),然後選取您要刪除之使用者名稱旁的核取方塊。

  3. 在頁面頂端,選擇 Delete (刪除)。

  4. 在刪user name? 」對話方塊中,在文字輸入欄位中輸入使用者名稱,以確認刪除使用者。選擇 刪除

後續步驟

完成本教學課程之後,您可以進一步探索下列相關的使用案例:

  • 您可以建立多個 S3 物件 Lambda 存取點,並使用預先建置的 Lambda 函數啟用這些函數,這些函數的設定方式會PII根據資料存取器的業務需求編寫特定類型。

    每種類型的使用者都擔任一個IAM角色,而且只能存取一個 S3 物件 Lambda 存取點 (透過IAM政策管理)。然後,您連接每個 ComprehendPiiRedactionS3ObjectLambda 針對不同 S3 Object Lambda 存取點的不同修訂使用案例設定 Lambda 函數。對於每個 S3 Object Lambda 存取點,您可以擁有支援的 S3 存取點,以便從存放共用資料集的 S3 儲存貯體讀取資料。

    如需如何建立 S3 儲存貯體政策,以允許使用者僅透過 S3 存取點讀取儲存貯體的詳細資訊,請參閱「設IAM定使用存取點的原則」。

    如需如何授予使用者存取 Lambda 函數、S3 存取點及 S3 Object Lambda 存取點之許可的相關資訊,請參閱 設IAM定物件 Lambda 存取點的政策

  • 您可以建置自己的 Lambda 函數,並將 S3 Object Lambda 搭配您自訂的 Lambda 函數使用,以滿足您的特定資料需求。

    例如,若要探索各種資料值,您可以使用 S3 Object Lambda 和您自己的 Lambda 函數,其中該函數會使用其他 Amazon Comprehend 功能 (例如實體辨識、金鑰片語辨識、情感分析和文件分類) 來處理資料。您也可以將 S3 物件 Lambda 與HIPAA符合條件的服務 Amazon Comprehend Medical NLP 服務搭配使用,以情境感知的方式分析和擷取資料。

    如需如何使用 S3 Object Lambda 和您自己的 Lambda 函數轉換資料的詳細資訊,請參閱「教學課程:使用 S3 Object Lambda 轉換應用程式的資料」。