使用 AWS Clean Rooms ML - AWS Clean Rooms

本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。

使用 AWS Clean Rooms ML

相似模型是訓練資料提供者資料的模型,可讓種子資料提供者建立與其種子資料最相似的訓練資料提供者資料的相似區段。若要建立可用於協同作業的相似模型,您必須匯入訓練資料、建立相似模型、設定該相似模型,然後將其與協同合作產生關聯。

訓練資料提供者建立 ML 模型後,種子資料提供者可以建立和匯出種子區段。

使用相似模型 (訓練資料提供者)

匯入訓練資料

在建立相似模型之前,您必須指定包含訓練資料的 AWS Glue 表格。無塵室 ML 不會儲存此資料的副本,只會儲存允許其存取資料的中繼資料。

若要匯入訓練資料 AWS Clean Rooms
  1. 登入 AWS Management Console 並使用您的AWS Clean Rooms 主機 AWS 帳戶 (如果您尚未這麼做) 開啟主機。

  2. 在左側導覽窗格中,選擇 [ML 模型]。

  3. 訓練資料集索引標籤上,選擇建立訓練資料集

  4. 輸入「名」與選擇性「說明」。

  5. 對於「資料來源」,請選擇 AWS Glue 表格:

    1. 從下拉列表中選擇要配置的數據庫

    2. 從下拉式清單中選取要設定的「資料」和「表格」,以選擇「訓練」資料來源。

    注意

    若要確認此表格是否正確,請執行下列任一項作業:

    • 選擇 [檢視於] AWS Glue。

    • 開啟 [檢視結構描述] 以檢視結構描述。

  6. 對於訓練詳細資料,請從資料中選擇 [使用者識別碼] 欄、[項目識別碼] 欄和 [時間戳記] 欄。訓練資料必須包含這三個欄位。您也可以選取要包含在訓練資料中的任何其他欄。

    「時間戳記」欄中的資料必須是 Unix 紀元時間 (以秒為單位)。

  7. 服務存取中,您必須指定可存取資料的服務角色,並在資料已加密時提供 KMS 金鑰。選擇 [建立並使用新的服務角色],Clean Rooms ML 就會自動建立服務角色並新增必要的權限原則。如果您有要使用的特定服務角色,請選擇 [使用現有服務角色],然後在 [服務角色名稱] 欄位中輸入該角色。

    如果您的資料已加密,請在AWS KMS key欄位中輸入您的 KMS 金鑰,或按一下建立 AWS KMS key以產生新的 KMS 金鑰。

  8. 如果您想要啟用訓練資料集的,請選擇 [新增標籤],然後輸入 [金鑰] 和 [] 配對。

  9. 選擇建立訓練資料集

如需相應的 API 動作,請參閱CreateTrainingDataset

建立相似模型

建立訓練資料集之後,您就可以建立相似模型了。您可以從單一訓練資料集建立許多相似模型。

您必須在您的中建立預設資料庫, AWS Glue Data Catalog 或在提供的角色中包含glue:createDatabase權限。

若要在中建立相似模型 AWS Clean Rooms
  1. 登入 AWS Management Console 並使用您的AWS Clean Rooms 主機 AWS 帳戶 (如果您尚未這麼做) 開啟主機。

  2. 在左側導覽窗格中,選擇 [ML 模型]。

  3. 在「相似模型」標籤上,選擇「建立相似模型」。

  4. 對於 「建立相似模型」,針對相似模型詳細資料:

    1. 輸入「名」與選擇性「說明」。

    2. 從下拉式清單中選擇您要建立模型的訓練資料集

    3. 輸入選擇性的訓練視窗

  5. 如果您要啟用相似模型的自訂加密設定,請選擇 [自訂加密設定],然後輸入 KMS 金鑰。

  6. 如果您要為相似模型啟用「」,請選擇「新增標籤」,然後輸入「金鑰」和「」配對。

  7. 選擇「建立相似模型」。

如需相應的 API 動作,請參閱CreateAudienceModel

設定相似模型

建立相似模型之後,您就可以將其設定為在協同作業中使用。您可以從單一相似模型建立多個已設定的相似模型。

若要在中設定相似模型 AWS Clean Rooms
  1. 登入 AWS Management Console 並使用您的AWS Clean Rooms 主機 AWS 帳戶 (如果您尚未這麼做) 開啟主機。

  2. 在左側導覽窗格中,選擇 [ML 模型]。

  3. 在 [設定的相似模型] 索引標籤上,選擇 [設定相似模型]。

  4. 對於配置相似模型,對於已配置的相似模型詳細信息:

    1. 輸入「名」與選擇性「說明」。

    2. 從下拉列表中選擇要配置的相似模型

    3. 選擇您想要的最小匹配種子大小。這是種子資料提供者資料中與訓練資料中使用者重疊的最小使用者數目。此值必須大於 0。

  5. 對於要與其他成員共用的指標,請選擇是否要讓共同作業中的種子資料提供者接收模型指標,包括相關性分數。

  6. 對於相似區段目的地位置,請輸入要匯出相似區段的 Amazon S3 儲存貯體。此值區必須與其他資源位於相同的區域。

  7. 對於「服務」存取,請選擇將用於存取此表格的現有服務角色名稱

  8. 選擇「設定相似模型」。

  9. 如果您要為已設定的表格資源啟用標,請選擇 [新增標記],然後輸入 [索引鍵] 和 [] 配對。

如需相應的 API 動作,請參閱CreateConfiguredAudienceModel

關聯已設定的相似模型

設定完相似模型之後,您可以將其與協同合作產生關聯。

將已設定的相似模型關聯於 AWS Clean Rooms
  1. 登入 AWS Management Console 並使用您的AWS Clean Rooms 主機 AWS 帳戶 (如果您尚未這麼做) 開啟主機。

  2. 在左側導覽窗格中,選擇「合作」。

  3. 在 [具有使用中成員資格] 索引標籤上,選擇合作。

  4. 在 [ML 建模] 索引標籤上,選擇 [關聯相似模型]。

  5. 對於關聯已設定的相似模型,對於關聯相似模型詳細資料:

    1. 為關聯的已設定對象模型輸入「名稱」。

    2. 輸入表格的「摘要」。

      此描述有助於區分具有相似名稱的其他關聯已設定對象模型。

  6. 對於「已設定的相似模型」,請從下拉式清單中選擇已設定的相似模型。

  7. 選擇關聯

如需相應的 API 動作,請參閱CreateConfiguredAudienceModelAssociation

更新已設定的相似模型

關聯設定的相似模型後,您可以更新它以變更名稱、要共用的指標或輸出 Amazon S3 位置等資訊。

若要在中更新關聯的已設定相似模型 AWS Clean Rooms
  1. 登入 AWS Management Console 並使用您的AWS Clean Rooms 主機 AWS 帳戶 (如果您尚未這麼做) 開啟主機。

  2. 在左側導覽窗格中,選擇 [ML 模型]。

  3. 在「已設定的相似模型」標籤中,選擇已設定的相似模型,然後選取「編輯」。

  4. 對於配置相似模型,對於已配置的相似模型詳細信息:

    1. 從下拉列表中選擇要配置的相似模型

    2. 選擇您想要的最小匹配種子大小。這是種子資料提供者資料中與訓練資料中使用者重疊的最小使用者數目。此值必須大於 0。

  5. 對於要與其他成員共用的指標,請選擇是否要讓共同作業中的種子資料提供者接收模型指標,包括相關性分數。

  6. 對於相似區段目的地位置,請輸入要匯出相似區段的 Amazon S3 儲存貯體。此值區必須與其他資源位於相同的區域。

  7. 對於「服務」存取,請選擇將用於存取此表格的現有服務角色名稱

  8. 對於「進階資料桶大小」設定,請選擇您要如何設定對象資料匣大小。

  9. 選擇儲存變更

如需相應的 API 動作,請參閱UpdateConfiguredAudienceModel

使用相似區段 (種子資料提供者)

建立相似區段

相似區段是訓練資料的子集,最接近種子資料。

若要在中建立相似區段 AWS Clean Rooms
  1. 登入 AWS Management Console 並使用您的AWS Clean Rooms 主機 AWS 帳戶 (如果您尚未這麼做) 開啟主機。

  2. 在左側導覽窗格中,選擇「合作」。

  3. 在 [具有使用中成員資格] 索引標籤上,選擇合作。

  4. 在 [ML 塑型] 索引標籤上,選擇 [建立相似區段]。

  5. 對於「建立相似區段」,對於相似區段詳細資訊,請輸入「名稱」和選用「說明」。

  6. 對於種子設定檔,請選擇存放種子資料的 Amazon S3 輸入來源

  7. 對於「服務」存取,請選擇將用於存取此表格的現有服務角色名稱

  8. 如果您想要啟用訓練資料集的,請選擇 [新增標籤],然後輸入 [金鑰] 和 [] 配對。

  9. 選擇「建立相似區段」。

如需相應的 API 動作,請參閱StartAudienceGenerationJob

匯出相似區段

建立相似區段後,您可以將該資料匯出到 Amazon S3 儲存貯體。

若要匯出相似區段 AWS Clean Rooms
  1. 登入 AWS Management Console 並使用您的AWS Clean Rooms 主機 AWS 帳戶 (如果您尚未這麼做) 開啟主機。

  2. 在左側導覽窗格中,選擇「合作」。

  3. 在 [具有使用中成員資格] 索引標籤上,選擇合作。

  4. 在 [ML 塑型] 索引標籤上,選取相似區段,然後選擇 [匯出]。

  5. 對於「匯出相似模型」,對於「匯出相似模型」,請輸入「名稱」和「描述」。

  6. 在「區段大小」中,選擇匯出區段所要的大小。

  7. 選擇 Export (匯出)。

如需相應的 API 動作,請參閱StartAudienceExportJob

後續步驟

現在您已經建立了相似的模型並匯出種子區段,您可以: