本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。
AWS Clean Rooms ML 允許兩個或多個方在其資料上執行機器學習模型,而不需要彼此共用其資料。此服務提供隱私權增強控制,讓資料擁有者能夠保護其資料及其模型 IP。您可以使用 AWS 撰寫的模型或自帶自訂模型。
如需如何運作的詳細說明,請參閱 跨帳戶任務。
如需 Clean Rooms ML 模型功能的詳細資訊,請參閱下列主題。
主題
AWS Clean Rooms ML 如何使用 AWS 模型

使用類似模型時,訓練資料提供者和種子資料提供者需要雙方依序在 中工作 AWS Clean Rooms ,以將資料納入協同合作。這是訓練資料提供者必須先完成的工作流程:
-
訓練資料提供者的資料必須存放在使用者項目互動 AWS Glue 的資料目錄資料表中。訓練資料至少必須包含使用者 ID 欄、互動 ID 欄和時間戳記欄。
-
訓練資料提供者向 註冊訓練資料 AWS Clean Rooms。
-
訓練資料提供者會建立外觀模型,可與多個種子資料提供者共用。外觀模型是一種深度神經網路,最多可能需要 24 小時才能訓練。它不會自動重新訓練,我們建議您每週重新訓練模型。
-
訓練資料提供者會設定類似模型,包括是否共用相關性指標和輸出區段的 Amazon S3 位置。訓練資料提供者可以從單一類似模型建立多個已設定的類似模型。
-
訓練資料提供者會將設定的對象模型與與種子資料提供者共用的協同合作建立關聯。
這是種子資料提供者接下來必須完成的工作流程:
-
種子資料提供者的資料可以存放在 Amazon S3 儲存貯體中,也可以來自查詢結果。
-
種子資料提供者會開啟他們與訓練資料提供者共用的協同合作。
-
種子資料提供者會從協作頁面的 Clean Rooms ML 索引標籤建立外觀相似的區段。
-
如果已共用,種子資料提供者可以評估相關性指標,並匯出外觀區段以供外部使用 AWS Clean Rooms。
AWS Clean Rooms ML 如何使用自訂模型
使用 Clean Rooms ML,協同合作的成員可以使用存放在 Amazon ECR 中的停駐自訂模型演算法來共同分析其資料。若要這樣做,模型提供者必須建立映像並將其存放在 Amazon ECR 中。請遵循 Amazon Elastic Container Registry 使用者指南中的步驟,建立將包含自訂 ML 模型的私有儲存庫。
協作的任何成員都可以是模型提供者,只要他們具有正確的許可。協作的所有成員都可以為模型提供訓練資料、推論資料或兩者。基於本指南的目的,貢獻資料的成員稱為資料提供者。建立協同合作的成員是協同合作建立者,而此成員可以是模型提供者、其中一個資料提供者,或兩者。
在最高層級,以下是執行自訂 ML 建模時必須完成的步驟:
-
協同合作建立者會建立協同合作,並為每個成員指派適當的成員能力和付款組態。協同合作建立者必須在此步驟中,將成員接收模型輸出或接收推論結果的能力指派給適當的成員,因為協同合作建立後無法更新。如需詳細資訊,請參閱建立協同合作。
-
模型提供者會設定其容器化 ML 模型並將其與協同合作建立關聯,並確保為匯出的資料設定隱私權限制。如需詳細資訊,請參閱設定模型演算法。
-
資料提供者會將他們的資料提供給協同合作,並確保已指定其隱私權需求。資料提供者必須允許模型存取其資料。如需詳細資訊,請參閱貢獻訓練資料及關聯設定的模型演算法。
-
協同合作成員會建立 ML 組態,定義模型成品或推論結果的匯出位置。
-
協同合作成員會建立 ML 輸入通道,提供訓練容器或推論容器的輸入。ML 輸入通道是一種查詢,定義要在模型演算法內容中使用的資料。
-
協同合作成員使用 ML 輸入通道和設定的模型演算法來叫用模型訓練。如需詳細資訊,請參閱建立訓練過的模型。
-
(選用) 模型訓練程式會叫用模型匯出任務,並將模型成品傳送至模型結果接收器。只有具有有效 ML 組態和成員能夠接收模型輸出的成員才能接收模型成品。如需詳細資訊,請參閱匯出模型成品。
-
(選用) 協同合作成員使用 ML 輸入通道、訓練模型 ARN 和推論設定的模型演算法調用模型推論。推論結果會傳送至推論輸出接收器。只有具有有效 ML 組態和能夠接收推論輸出的成員,才能接收推論結果。
以下是模型提供者必須完成的步驟:
-
建立與 SageMaker AI 相容的 Amazon ECR Docker 映像。Clean Rooms ML 僅支援 SageMaker AI 相容 Docker 映像。
-
建立 SageMaker AI 相容 Docker 映像之後,請將映像推送至 Amazon ECR。請遵循 Amazon Elastic Container Registry 使用者指南中的指示來建立容器訓練映像。
-
設定模型演算法以用於 Clean Rooms ML。
-
提供 Amazon ECR 儲存庫連結和設定模型演算法所需的任何引數。
-
提供服務存取角色,允許 Clean Rooms ML 存取 Amazon ECR 儲存庫。
-
將設定的模型演算法與協同合作建立關聯。這包括提供隱私權政策,定義容器日誌、失敗日誌、CloudWatch 指標的控制項,以及可從容器結果匯出多少資料的限制。
-
以下是資料提供者必須完成的步驟,才能與自訂 ML 模型協作:
-
使用自訂分析規則設定現有 AWS Glue 資料表。這允許一組特定的預先核准查詢或預先核准的帳戶使用您的資料。
-
將已設定的資料表與協同合作建立關聯,並提供可存取 AWS Glue 資料表的服務存取角色。
-
將協同合作分析規則新增至資料表,以允許設定的模型演算法關聯存取設定的資料表。
-
在 Clean Rooms ML 中關聯和設定模型和資料之後,具有執行查詢功能的成員會提供 SQL 查詢,並選取要使用的模型演算法。
模型訓練完成後,該成員會啟動模型訓練成品或推論結果的匯出。這些成品或結果會傳送給能夠接收訓練模型輸出的成員。結果接收者必須先設定其 ,MachineLearningConfiguration
才能接收模型輸出。