AWS Clean Rooms ML でのトレーニングデータの提供 - AWS Clean Rooms

翻訳は機械翻訳により提供されています。提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。

AWS Clean Rooms ML でのトレーニングデータの提供

コラボレーション作成者がコラボレーションを作成し、招待されたメンバーが参加したら、トレーニングデータをコラボレーションに提供する準備が整います。どのメンバーもトレーニングデータを提供できます。

Console
トレーニングデータを提供するには (コンソール)
  1. にサインイン AWS Management Console し、https://console.aws.amazon.com/cleanrooms で AWS Clean Rooms コンソールを開きます。

  2. 左のナビゲーションペインで、[テーブル] を選択します。

  3. Tables ページで、Configure new table を選択します。

  4. 新しいテーブルを設定する データソース でAmazon S3Amazon Athena、または Snowflake を選択し、データソースに基づいて次の手順を実行します。

    を使用している場合 THEN
    Amazon S3
    1. ドロップダウンリストからデータベースを選択し、データベースからテーブルを選択します。

    2. [コラボレーションで許可された列] で、[すべての列] または [カスタムリスト] を選択します。

    3. 設定済みテーブルの詳細については、このテーブルの名前とオプションの説明を指定します。

    4. モデルメトリクスを報告する場合は、メトリクスの名前と、出力ログを検索してメトリクスを検索する正規表現ステートメントを入力します。

    5. 設定済みテーブルのリソースでタグを有効にする場合は、[新しいタグを追加] を選択し、キーのペアを入力します。

    Amazon Athena
    1. ドロップダウンリストからデータベースを選択し、データベースからテーブルを選択します。

    2. [コラボレーションで許可された列] で、[すべての列] または [カスタムリスト] を選択します。

    3. 設定済みテーブルの詳細については、このテーブルの名前とオプションの説明を指定します。

    4. モデルメトリクスをレポートする場合は、メトリクスの名前と、出力ログを検索してメトリクスを検索する正規表現ステートメントを入力します。

    5. 設定済みテーブルのリソースでタグを有効にする場合は、[新しいタグを追加] を選択し、キーのペアを入力します。

    Snowflake
    1. 既存のシークレット ARN を使用するか、このテーブルの新しいシークレットを保存して、Snowflake 認証情報を指定します。

    2. Snowflake テーブルとスキーマの詳細には、詳細を手動で入力するか、詳細を自動的にインポートします。

    3. スキーマには、列名を入力し、ドロップダウンリストからデータ型を選択します。

    4. 設定済みテーブルのリソースでタグを有効にする場合は、[新しいタグを追加] を選択し、キーのペアを入力します。

  5. [新しいテーブルを設定] を選択します。

  6. テーブルの詳細ページで、分析ルールを設定を選択して、このテーブルのカスタム分析ルールを設定します。カスタム分析ルールは、データへのアクセスを制限します。データに対して事前に承認された特定のクエリセットを許可するか、特定のアカウントのセットにデータのクエリを許可できます。

    1. 分析ルールタイプカスタムを選択し、作成方法ガイド付きフローを選択します。

    2. [次へ] を選択します。

    3. 分析コントロールを指定する では、新しい各分析を確認する と、特定の共同作業者による分析を許可する のどちらかを選択します。

    4. [次へ] を選択します。

    5. (オプション) 分析結果のコントロールを指定する では、出力で許可されていない列に、出力から列を除外するかどうかを指定します。None を選択した場合、出力から除外される列はありません。カスタムリストを選択した場合は、出力から削除する特定の列を指定できます。

    6. 出力に適用される追加分析では、結果を生成する前に追加の分析を許可、拒否、または要求するかどうかを指定します。

    7. [次へ] を選択します。

    8. (オプション) 差分プライバシーを設定する で、無効化を選択します。

    9. [次へ] を選択します。

    10. 「確認と設定」ページの情報を確認し、「分析ルールの設定」を選択します。

  7. テーブルの詳細ページから、コラボレーションに関連付けるを選択します。

  8. テーブルの関連付けダイアログボックスで、このテーブルを関連付けるコラボレーションを選択し、コラボレーションの選択を選択します。

  9. テーブルの関連付けページで、テーブルの関連付けの詳細サービスアクセスタグの情報を確認して確認します。[テーブルを関連付ける] を選択します。

  10. テーブルに関連付けられたテーブルで、先ほど関連付けたテーブルの横にあるラジオボタンを選択します。Actions メニューから、コラボレーション分析ルールグループの Configure を選択します。

  11. コラボレーション分析ルールの設定ページで、許可される追加分析について、コラボレーションメンバーまたは特定のコラボレーションメンバーが追加分析を実行できるかどうかを選択します。

    結果配信では、クエリ出力から結果を受信できるメンバーを選択します。

  12. [分析ルールを設定] を選択します。

API

トレーニングデータを提供するには (API)

  1. AWS Glue テーブルと使用できる列を指定 AWS Clean Rooms して、 で使用する既存のテーブルを設定します。

    特定のパラメータで次のコードを実行します。

    import boto3 acr_client= boto3.client('cleanrooms') acr_client.create_configured_table( name='configured_table_name', tableReference= { 'glue': { 'tableName': 'glue_table_name', 'databaseName': 'glue_database_name' } }, analysisMethod="DIRECT_QUERY", allowedColumns=["column1", "column2", "column3",...] )
  2. データへのアクセスを制限するカスタム分析ルールを設定します。データに対して事前に承認された特定のクエリセットを許可するか、特定のアカウントのセットにデータのクエリを許可できます。

    特定のパラメータで次のコードを実行します。

    import boto3 acr_client= boto3.client('cleanrooms') acr_client.create_configured_table_analysis_rule( configuredTableIdentifier='configured_table_id', analysisRuleType='CUSTOM', analysisRulePolicy= { 'v1': { 'custom': { 'allowedAnalyses': ['ANY_QUERY'], 'allowedAnalysisProviders': ['query_runner_account'], 'additionalAnalyses': "REQUIRED" } } } )

    この例では、特定のアカウントがデータに対してクエリを実行でき、追加の分析が必要です。

  3. 設定済みテーブルをコラボレーションに関連付け、サービスアクセスロールを AWS Glue テーブルに提供します。

    特定のパラメータで次のコードを実行します。

    import boto3 acr_client= boto3.client('cleanrooms') acr_client.create_configured_table_association( name='configured_table_association_name', membershipIdentifier='membership_id', configuredTableIdentifier='configured_table_id', roleArn='arn:aws:iam::account:role/role_name' )
    注記

    このサービスロールにはテーブルに対するアクセス許可があります。サービスロールは、クエリを実行できるメンバーに代わって許可されたクエリを実行する AWS Clean Rooms ために によってのみ引き受けることができます。コラボレーションメンバー (データの所有者以外) は誰も、コラボレーションの基になるテーブルにはアクセスできません。データ所有者は差分プライバシーをオフにして、テーブルを他のメンバーがクエリできるようにすることができます。

  4. 最後に、設定されたテーブルの関連付けに分析ルールを追加します。

    特定のパラメータで次のコードを実行します。

    import boto3 acr_client= boto3.client('cleanrooms') acr_client.create_configured_table_association_analysis_rule( configuredTableAssociationIdentifier='configured_table_association_identifier', membershipIdentifier='membership_id', configuredTableIdentifier='configured_table_id', analysisRuleType = 'CUSTOM', analysisRulePolicy= { 'v1': { 'custom': { 'allowedAdditionalAnalyses': ['configured_model_algorithm_association_arns'], 'allowedResultReceivers': ['query_runner_account'] } } } )