翻訳は機械翻訳により提供されています。提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。
AWS Clean Rooms ML でのトレーニングデータの提供
コラボレーション作成者がコラボレーションを作成し、招待されたメンバーが参加したら、トレーニングデータをコラボレーションに提供する準備が整います。どのメンバーもトレーニングデータを提供できます。
- Console
-
トレーニングデータを提供するには (コンソール)
-
にサインイン AWS Management Console し、https://console.aws.amazon.com/cleanrooms
で AWS Clean Rooms コンソールを開きます。 -
左のナビゲーションペインで、[テーブル] を選択します。
-
Tables ページで、Configure new table を選択します。
-
新しいテーブルを設定する データソース で、Amazon S3、Amazon Athena、または Snowflake を選択し、データソースに基づいて次の手順を実行します。
を使用している場合 THEN Amazon S3 -
ドロップダウンリストからデータベースを選択し、データベースからテーブルを選択します。
-
[コラボレーションで許可された列] で、[すべての列] または [カスタムリスト] を選択します。
-
設定済みテーブルの詳細については、このテーブルの名前とオプションの説明を指定します。
-
モデルメトリクスを報告する場合は、メトリクスの名前と、出力ログを検索してメトリクスを検索する正規表現ステートメントを入力します。
-
設定済みテーブルのリソースでタグを有効にする場合は、[新しいタグを追加] を選択し、キーと値のペアを入力します。
Amazon Athena -
ドロップダウンリストからデータベースを選択し、データベースからテーブルを選択します。
-
[コラボレーションで許可された列] で、[すべての列] または [カスタムリスト] を選択します。
-
設定済みテーブルの詳細については、このテーブルの名前とオプションの説明を指定します。
-
モデルメトリクスをレポートする場合は、メトリクスの名前と、出力ログを検索してメトリクスを検索する正規表現ステートメントを入力します。
-
設定済みテーブルのリソースでタグを有効にする場合は、[新しいタグを追加] を選択し、キーと値のペアを入力します。
Snowflake -
既存のシークレット ARN を使用するか、このテーブルの新しいシークレットを保存して、Snowflake 認証情報を指定します。
-
Snowflake テーブルとスキーマの詳細には、詳細を手動で入力するか、詳細を自動的にインポートします。
-
スキーマには、列名を入力し、ドロップダウンリストからデータ型を選択します。
-
設定済みテーブルのリソースでタグを有効にする場合は、[新しいタグを追加] を選択し、キーと値のペアを入力します。
-
-
[新しいテーブルを設定] を選択します。
-
テーブルの詳細ページで、分析ルールを設定を選択して、このテーブルのカスタム分析ルールを設定します。カスタム分析ルールは、データへのアクセスを制限します。データに対して事前に承認された特定のクエリセットを許可するか、特定のアカウントのセットにデータのクエリを許可できます。
-
分析ルールタイプでカスタムを選択し、作成方法でガイド付きフローを選択します。
-
[次へ] を選択します。
-
分析コントロールを指定する では、新しい各分析を確認する と、特定の共同作業者による分析を許可する のどちらかを選択します。
-
[次へ] を選択します。
-
(オプション) 分析結果のコントロールを指定する では、出力で許可されていない列に、出力から列を除外するかどうかを指定します。None を選択した場合、出力から除外される列はありません。カスタムリストを選択した場合は、出力から削除する特定の列を指定できます。
-
出力に適用される追加分析では、結果を生成する前に追加の分析を許可、拒否、または要求するかどうかを指定します。
-
[次へ] を選択します。
-
(オプション) 差分プライバシーを設定する で、無効化を選択します。
-
[次へ] を選択します。
-
「確認と設定」ページの情報を確認し、「分析ルールの設定」を選択します。
-
-
テーブルの詳細ページから、コラボレーションに関連付けるを選択します。
-
テーブルの関連付けダイアログボックスで、このテーブルを関連付けるコラボレーションを選択し、コラボレーションの選択を選択します。
-
テーブルの関連付けページで、テーブルの関連付けの詳細、サービスアクセス、タグの情報を確認して確認します。[テーブルを関連付ける] を選択します。
-
テーブルに関連付けられたテーブルで、先ほど関連付けたテーブルの横にあるラジオボタンを選択します。Actions メニューから、コラボレーション分析ルールグループの Configure を選択します。
-
コラボレーション分析ルールの設定ページで、許可される追加分析について、コラボレーションメンバーまたは特定のコラボレーションメンバーが追加分析を実行できるかどうかを選択します。
結果配信では、クエリ出力から結果を受信できるメンバーを選択します。
-
[分析ルールを設定] を選択します。
-
- API
-
トレーニングデータを提供するには (API)
-
AWS Glue テーブルと使用できる列を指定 AWS Clean Rooms して、 で使用する既存のテーブルを設定します。
特定のパラメータで次のコードを実行します。
import boto3 acr_client= boto3.client('cleanrooms') acr_client.create_configured_table( name='
configured_table_name
', tableReference= { 'glue': { 'tableName': 'glue_table_name
', 'databaseName': 'glue_database_name
' } }, analysisMethod="DIRECT_QUERY", allowedColumns=["column1
", "column2
", "column3
",...] ) -
データへのアクセスを制限するカスタム分析ルールを設定します。データに対して事前に承認された特定のクエリセットを許可するか、特定のアカウントのセットにデータのクエリを許可できます。
特定のパラメータで次のコードを実行します。
import boto3 acr_client= boto3.client('cleanrooms') acr_client.create_configured_table_analysis_rule( configuredTableIdentifier='
configured_table_id
', analysisRuleType='CUSTOM', analysisRulePolicy= { 'v1': { 'custom': { 'allowedAnalyses': ['ANY_QUERY'], 'allowedAnalysisProviders': ['query_runner_account
'], 'additionalAnalyses': "REQUIRED" } } } )この例では、特定のアカウントがデータに対してクエリを実行でき、追加の分析が必要です。
-
設定済みテーブルをコラボレーションに関連付け、サービスアクセスロールを AWS Glue テーブルに提供します。
特定のパラメータで次のコードを実行します。
import boto3 acr_client= boto3.client('cleanrooms') acr_client.create_configured_table_association( name='
configured_table_association_name
', membershipIdentifier='membership_id
', configuredTableIdentifier='configured_table_id
', roleArn='arn:aws:iam::account
:role
/role_name
' )注記
このサービスロールにはテーブルに対するアクセス許可があります。サービスロールは、クエリを実行できるメンバーに代わって許可されたクエリを実行する AWS Clean Rooms ために によってのみ引き受けることができます。コラボレーションメンバー (データの所有者以外) は誰も、コラボレーションの基になるテーブルにはアクセスできません。データ所有者は差分プライバシーをオフにして、テーブルを他のメンバーがクエリできるようにすることができます。
-
最後に、設定されたテーブルの関連付けに分析ルールを追加します。
特定のパラメータで次のコードを実行します。
import boto3 acr_client= boto3.client('cleanrooms') acr_client.create_configured_table_association_analysis_rule( configuredTableAssociationIdentifier='
configured_table_association_identifier
', membershipIdentifier='membership_id
', configuredTableIdentifier='configured_table_id
', analysisRuleType = 'CUSTOM', analysisRulePolicy= { 'v1': { 'custom': { 'allowedAdditionalAnalyses': ['configured_model_algorithm_association_arns
'], 'allowedResultReceivers': ['query_runner_account
'] } } } )
-