AWS Clean Rooms ML 術語 AWS Clean Rooms ML 如何與 AWS 模型搭配使用 AWS Clean Rooms ML 如何與自訂模型搭配使用

AWS 無塵室 ML

AWS Clean Rooms ML 允許兩方或多方對其資料執行機器學習模型，而不需要彼此共用其資料。此服務提供隱私權增強控制，允許資料擁有者保護其資料及其模型 IP。您可以使用 AWS 撰寫的模型或自備自訂模型。

如需如何運作的詳細說明，請參閱跨帳戶任務。

如需 Clean Rooms ML 模型功能的詳細資訊，請參閱下列主題。

主題

AWS Clean Rooms ML 術語
AWS Clean Rooms ML 如何與 AWS 模型搭配使用
AWS Clean Rooms ML 如何與自訂模型搭配使用
AWS Clean Rooms ML 中的模型
Clean Rooms ML 中的自訂模型

AWS Clean Rooms ML 術語

使用 Clean Rooms ML 時，請務必了解下列術語：

訓練資料提供者 – 提供訓練資料的一方，建立和設定類似模型，然後將類似模型與協同合作建立關聯。
種子資料提供者 – 提供種子資料、產生類似區段，以及匯出其類似區段的一方。
訓練資料 – 訓練資料提供者的資料，用於產生類似模型。訓練資料用於測量使用者行為中的相似性。

訓練資料必須包含使用者 ID、項目 ID 和時間戳記欄。或者，訓練資料可以包含數值或分類功能的其他互動。互動的範例包括觀看的影片、購買的項目或文章讀取的清單。
種子資料 – 種子資料提供者的資料，用於建立外觀相似的區段。種子資料可以直接提供，也可以來自 AWS Clean Rooms 查詢的結果。看起來像區段輸出是一組來自訓練資料的使用者，最接近種子使用者。
Lookalike 模型 – 訓練資料的機器學習模型，用於在其他資料集中找到類似的使用者。

使用 API 時，對象模型一詞會同等用於看起來像模型。例如，您可以使用 CreateAudienceModel API 來建立類似模型。
Lookalike 區段 – 訓練資料的子集，最接近種子資料。

使用 API 時，您可以使用 StartAudienceGenerationJob API 建立類似樣的客群。

訓練資料提供者的資料絕不會與種子資料提供者共用，而種子資料提供者的資料也絕不會與訓練資料提供者共用。看起來像區段的輸出會與訓練資料提供者共用，但絕不會與種子資料提供者共用。

AWS Clean Rooms ML 如何與 AWS 模型搭配使用

使用類似模型需要訓練資料提供者和種子資料提供者的雙方，依序在中工作 AWS Clean Rooms ，將他們的資料帶入協同合作。這是訓練資料提供者必須先完成的工作流程：

訓練資料提供者的資料必須存放在使用者項目互動 AWS Glue 的資料目錄資料表中。訓練資料至少必須包含使用者 ID 欄、互動 ID 欄和時間戳記欄。
訓練資料提供者向註冊訓練資料 AWS Clean Rooms。
訓練資料提供者會建立外觀相似的模型，可與多個種子資料提供者共用。外觀模型是一種深度神經網路，最多可能需要 24 小時才能訓練。它不會自動重新訓練，我們建議您每週重新訓練模型。
訓練資料提供者會設定類似模型，包括是否共用相關性指標和輸出區段的 Amazon S3 位置。訓練資料提供者可以從單一外觀模型建立多個已設定的外觀模型。
訓練資料提供者會將設定的對象模型與與種子資料提供者共用的協同合作建立關聯。

這是種子資料提供者接下來必須完成的工作流程：

種子資料提供者的資料可以存放在 Amazon S3 儲存貯體中，也可以來自查詢結果。
種子資料提供者會開啟他們與訓練資料提供者共用的協同合作。
種子資料提供者會從協作頁面的 Clean Rooms ML 索引標籤建立外觀相似的區段。
如果關聯性指標已共用，則種子資料提供者可以評估它們，並匯出外觀區段以供外部使用 AWS Clean Rooms。

AWS Clean Rooms ML 如何與自訂模型搭配使用

透過 Clean Rooms ML，協同合作的成員可以使用存放在 Amazon ECR 中的停駐自訂模型演算法來共同分析其資料。若要這樣做，模型提供者必須建立映像並將其存放在 Amazon ECR 中。請遵循 Amazon Elastic Container Registry 使用者指南中的步驟，建立將包含自訂 ML 模型的私有儲存庫。

協同合作的任何成員都可以是模型提供者，只要他們具有正確的許可。協同合作的所有成員都可以為模型提供訓練資料、推論資料或兩者。基於本指南的目的，貢獻資料的成員稱為資料提供者。建立協同合作的成員是協同合作建立者，而此成員可以是模型提供者、其中一個資料提供者，或兩者。

在最高層級，以下是執行自訂 ML 建模時必須完成的步驟：

協同合作建立者會建立協同合作，並為每個成員指派適當的成員能力和付款組態。協同合作建立者必須在此步驟中將成員接收模型輸出或接收推論結果的能力指派給適當的成員，因為它無法在協同合作建立後更新。如需詳細資訊，請參閱在 AWS Clean Rooms ML 中建立和加入協同合作。
模型提供者會設定其容器化 ML 模型並將其與協同合作建立關聯，並確保針對匯出的資料設定隱私權限制。如需詳細資訊，請參閱在 AWS Clean Rooms ML 中設定模型演算法。
資料提供者將其資料提供給協同合作，並確保已指定其隱私權需求。資料提供者必須允許模型存取其資料。如需詳細資訊，請參閱在 AWS Clean Rooms ML 中貢獻訓練資料及在 AWS Clean Rooms ML 中關聯設定的模型演算法。
協同合作成員會建立 ML 組態，定義模型成品或推論結果的匯出位置。
協同合作成員會建立 ML 輸入通道，提供訓練容器或推論容器的輸入。ML 輸入通道是一種查詢，可定義要在模型演算法內容中使用的資料。
協同合作成員使用 ML 輸入通道和設定的模型演算法叫用模型訓練。如需詳細資訊，請參閱在 AWS Clean Rooms ML 中建立訓練過的模型。
（選用）模型訓練器會叫用模型匯出任務，並將模型成品傳送至模型結果接收器。只有具有有效 ML 組態和能夠接收模型輸出的成員才能接收模型成品。如需詳細資訊，請參閱從 AWS Clean Rooms ML 匯出模型成品。
（選用）協同合作成員使用 ML 輸入通道、訓練模型 ARN 和推論設定的模型演算法叫用模型推論。推論結果會傳送至推論輸出接收器。只有具有有效 ML 組態和能夠接收推論輸出的成員才能接收推論結果。

以下是模型提供者必須完成的步驟：

建立與 SageMaker AI 相容的 Amazon ECR Docker 映像。Clean Rooms ML 僅支援 SageMaker AI 相容 Docker 映像。
建立 SageMaker AI 相容 Docker 映像之後，請將映像推送至 Amazon ECR。遵循 Amazon Elastic Container Registry 使用者指南中的指示來建立容器訓練映像。
設定模型演算法以用於 Clean Rooms ML。
1. 提供 Amazon ECR 儲存庫連結和設定模型演算法所需的任何引數。
2. 提供服務存取角色，允許 Clean Rooms ML 存取 Amazon ECR 儲存庫。
3. 將設定的模型演算法與協同合作建立關聯。這包括提供隱私權政策，定義容器日誌、故障日誌、CloudWatch 指標的控制，以及可從容器結果匯出多少資料的限制。

以下是資料提供者必須完成的步驟，才能與自訂 ML 模型協作：

使用自訂分析規則設定現有 AWS Glue 資料表。這允許一組特定的預先核准查詢或預先核准的帳戶使用您的資料。
將已設定的資料表與協同合作建立關聯，並提供可存取 AWS Glue 資料表的服務存取角色。
將協同合作分析規則新增至資料表，以允許設定的模型演算法關聯存取設定的資料表。
在 Clean Rooms ML 中關聯和設定模型和資料之後，具有執行查詢功能的成員會提供 SQL 查詢，並選取要使用的模型演算法。

模型訓練完成後，該成員會啟動模型訓練成品或推論結果的匯出。這些成品或結果會傳送給能夠接收訓練模型輸出的成員。結果接收者必須先設定其，MachineLearningConfiguration才能接收模型輸出。

您的瀏覽器已停用或無法使用 Javascript。

您必須啟用 Javascript，才能使用 AWS 文件。請參閱您的瀏覽器說明頁以取得說明。

文件慣用形式

限制

AWS Clean Rooms ML 中的模型