Amazon DataZone ドメインを所有するアカウントで AWS 組み込みブループリントを有効にする - Amazon DataZone

翻訳は機械翻訳により提供されています。提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。

Amazon DataZone ドメインを所有するアカウントで AWS 組み込みブループリントを有効にする

環境が作成されるブループリントは、環境が属するプロジェクトのメンバーは、Amazon DataZone カタログ内のアセットを操作するときにどのツールやサービスを使用できるかを定義します。

Amazon の現在のリリースでは DataZone、データレイクブループリント、データウェアハウスブループリント、Amazon ブループリントのいくつかの組み込み SageMaker ブループリントがあります。

  • データレイクの設計図には、Amazon DataZone カタログでデータレイクアセットを公開および使用するための一連のサービス (AWS Glue、 AWS Lake Formation、Amazon Athena ) を起動および設定するための定義が含まれています。

  • データウェアハウスの設計図には、Amazon DataZone カタログで Amazon Redshift アセットを公開および使用するための一連の サービス (Amazon Redshift) を起動および設定するための定義が含まれています。

  • Amazon SageMaker ブループリントには、Amazon DataZone カタログで Amazon SageMaker アセットを公開および使用するための一連の サービス (Amazon SageMaker Studio) を起動および設定するための定義が含まれています。

詳細については、「Amazon DataZone の用語と概念」を参照してください。

Amazon DataZone ドメインの作成時に、ドメイン作成プロセスの一環としてデフォルトのデータレイクとデフォルトのデータウェアハウスの組み込みブループリントを自動的に有効にするクイックセットアップを選択することもできます。クイックセットアップでは、これらの組み込みブループリントを使用して、デフォルトの環境プロファイルとデフォルトの環境も作成されます。

Amazon DataZone ドメインの作成の一環としてクイックセットアップを選択しない場合は、以下の手順に従って、この Amazon DataZone ドメインを格納する AWS アカウントで使用可能な組み込みブループリントを有効にできます。これらの組み込みブループリントを使用して、このドメインで環境プロファイルと環境を作成する前に、これらの組み込みブループリントを有効にする必要があります。

Amazon DataZone マネジメントコンソールを介して Amazon DataZone ドメインで組み込みブループリントを有効にするには、管理アクセス許可を持つアカウントで IAMロールを引き受ける必要があります。 は、最小限のアクセス許可Amazon DataZone マネジメントコンソールを使用するために必要なIAMアクセス許可を設定するを取得します。

Amazon DataZone ドメインで組み込みブループリントを有効にする
  1. https://console.aws.amazon.com/datazone で Amazon DataZone コンソールに移動し、アカウントの認証情報を使用してサインインします。

  2. ドメインを表示を選択し、1 つ以上の組み込みブループリントを有効にするドメインを選択します。

  3. ドメインの詳細ページで、ブループリントタブに移動します。

  4. ブループリントリストから、 DefaultDataLakeまたは DefaultDataWarehouse、または Amazon SageMaker ブループリントを選択します。

  5. 選択したブループリントの詳細ページで、このアカウント で有効化 を選択します。

  6. アクセス許可とリソースページで、以下を指定します。

    • DefaultDataLake ブループリントを有効にする場合は、 Glue 管理アクセスロール で、 AWS Glue と AWS Lake Formation のテーブルへのアクセスを取り込み、管理する DataZone 権限を Amazon に付与する新規または既存のサービスロールを指定します。

    • DefaultDataWarehouse ブループリントを有効にする場合は、Redshift のアクセス管理ロール で、Amazon Redshift のデータ共有、テーブル、ビューへのアクセスを取り込み、管理する DataZone 権限を Amazon に付与する新規または既存のサービスロールを指定します。

    • Amazon SageMaker ブループリントを有効にする場合は、SageMaker アクセス管理ロール で、Amazon SageMaker データをカタログに発行するアクセス許可を Amazon DataZone に付与する新規または既存のサービスロールを指定します。また、カタログ内の Amazon が SageMaker 公開したアセットへのアクセスを許可または取り消すアクセス DataZone 許可も Amazon に付与します。

      重要

      Amazon SageMaker ブループリントを有効にすると、Amazon は Amazon の次のIAMロールが現在のアカウントとリージョン DataZone に存在する DataZone かどうかを確認します。これらのロールが存在しない場合、Amazon DataZone によって自動的に作成されます。

      • AmazonDataZoneGlueAccess-<region>-<domainId>

      • AmazonDataZoneRedshiftAccess-<region>-<domainId>

    • プロビジョニングロール には、環境アカウントとリージョン AWS CloudFormation で を使用して環境リソースを作成および設定する DataZone 権限を Amazon に付与する新規または既存のサービスロールを指定します。

    • Amazon SageMaker ブループリントを有効にする場合は、 SageMaker-Glue データソース の Amazon S3 バケットに、 AWS アカウント内のすべての SageMaker 環境で使用される Amazon S3 バケットを指定します。指定するバケットプレフィックスは、次のいずれかである必要があります。

      • Amazon データゾーン*

      • datazone-sagemaker*

      • sagemaker-datazone*

      • DataZone-Sagemaker*

      • Sagemaker-DataZone*

      • DataZone-SageMaker*

      • SageMaker-DataZone*

  7. ブループリントを有効にする を選択します。

選択したブループリント (複数可) を有効にすると、アカウントでブループリントを使用して環境プロファイルを作成できるプロジェクトを制御できます。これを行うには、プロジェクトの管理をブループリントの設定に割り当てます。

重要

デフォルトでは、環境ブループリントの管理プロジェクトは指定されません。つまり、Amazon DataZone ユーザーは環境ブループリントのプロファイルを作成できます。したがって、ガバナンスを強化するために、環境ブループリントの管理プロジェクトを常に指定することを強くお勧めします。

有効なブループリントでプロジェクトの管理を指定する
  1. https://console.aws.amazon.com/datazone で Amazon DataZone コンソールに移動し、アカウント認証情報を使用してサインインします。

  2. ドメインを表示 を選択し、選択したブループリントの管理プロジェクトを追加するドメイン (複数可) を選択します。

  3. ブループリント タブを選択し、使用するブループリントを選択します。

  4. デフォルトでは、ドメイン内のすべてのプロジェクトは、 DefaultDataLake または DefaultDataWareshouse、またはアカウント内の Amazon SageMaker ブループリントを使用して環境プロファイルを作成できます。ただし、プロジェクト管理をブループリントに割り当てることで、これを制限できます。管理プロジェクトを追加するには、「管理プロジェクトを選択」を選択し、ドロップダウンメニューから管理プロジェクトとして追加するプロジェクトを選択し、「管理プロジェクトを選択」(複数可) を選択します。

AWS アカウントで DefaultDataWarehouse ブループリントを有効にすると、パラメータセットをブループリント設定に追加できます。パラメータセットはキーと値のグループであり、Amazon Redshift クラスターへの接続を確立 DataZone するために Amazon が必要とするもので、データウェアハウス環境の作成に使用されます。これらのパラメータには、Amazon Redshift クラスター、データベースの名前、およびクラスターへの認証情報を保持する AWS シークレットが含まれます。

DefaultDataWarehouse 設計図へのパラメータセットの追加
  1. https://console.aws.amazon.com/datazone で Amazon DataZone コンソールに移動し、 アカウントの認証情報を使用してサインインします。

  2. ドメインを表示を選択し、パラメータセットを追加するドメインを選択します。

  3. ブループリントタブを選択し、 DefaultDataWareshouse ブループリントを選択してブループリントの詳細ページを開きます。

  4. 設計図の詳細ページのパラメータセットタブで、パラメータセットの作成 を選択します。

    • パラメータセットの名前を指定します。

    • 必要に応じて、パラメータセットの説明を入力します。

    • リージョンの選択

    • Amazon Redshift クラスターまたは Amazon Redshift Serverless のいずれかを選択します。

    • 選択した Amazon Redshift クラスターまたは Amazon Redshift Serverless ワークグループの認証情報ARNを保持するシーク AWS レットを選択します。シー AWS クレットをパラメータセット内で使用できるようにするには、 AmazonDataZoneDomain : [Domain_ID] タグでタグ付けする必要があります。

      • 既存の AWS シークレットがない場合は、新しいシークレットの作成 を選択して新しい AWS シークレットを作成することもできます。これにより、シークレットの名前、ユーザー名、パスワードを指定できるダイアログボックスが開きます。新しい AWS シークレットの作成 を選択すると、Amazon DataZone は AWS Secrets Manager サービスに新しいシークレットを作成し、パラメータセットを作成しようとしているドメインでシークレットにタグが付けられていることを確認します。

    • 上記のステップで Amazon Redshift クラスターを選択した場合は、ドロップダウンからクラスターを選択します。上記のステップで Amazon Redshift ワークグループを選択した場合は、ドロップダウンリストからワークグループを選択します。

    • 選択した Amazon Redshift クラスターまたは Amazon Redshift Serverless ワークグループ内のデータベースの名前を入力します。

    • パラメータセットの作成 を選択します。

注記

設計図に追加できるパラメータセットは最大 10 DefaultDataWarehouse個までです。

AWS アカウントで Amazon SageMaker ブループリントを有効にすると、パラメータセットをブループリント設定に追加できます。パラメータセットはキーと値のグループであり、Amazon が Amazon への接続を確立 DataZone するために必要 SageMaker であり、sagemaker 環境の作成に使用されます。

Amazon SageMaker ブループリントへのパラメータセットの追加
  1. https://console.aws.amazon.com/datazone で Amazon DataZone コンソールに移動し、 アカウントの認証情報を使用してサインインします。

  2. ドメインを表示を選択し、パラメータセットを追加する有効なブループリントを含むドメインを選択します。

  3. ブループリントタブを選択し、Amazon SageMaker ブループリントを選択してブループリントの詳細ページを開きます。

  4. 設計図の詳細ページのパラメータセットタブで、パラメータセットの作成 を選択し、以下を指定します。

    • パラメータセットの名前を指定します。

    • 必要に応じて、パラメータセットの説明を指定します。

    • Amazon SageMaker ドメイン認証タイプを指定します。IAM または IAM Identity Center () のいずれかを選択できますSSO。

    • AWS リージョンを指定します。

    • データ暗号化用の キーを指定します AWS KMS。既存のキーを選択するか、新しいキーを作成できます。

    • 環境パラメータ で、以下を指定します。

      • VPC ID - Amazon SageMaker 環境VPCの に使用している ID。既存の を指定するか、新しい を作成できますVPC。

      • サブネット - 内の特定のリソースの IP アドレスIDs範囲の 1 つ以上の VPC。

      • ネットワークアクセス - VPCのみまたはパブリックインターネットのみを選択します。

      • セキュリティグループ - VPCおよび サブネットを設定するときに使用するセキュリティグループ。

    • データソースパラメータで、次のいずれかを選択します。

      • AWS Glue のみ

      • AWS Glue + Amazon Redshift Serverless。このオプションを選択した場合は、以下を指定します。

        • 選択した Amazon Redshift クラスターの認証情報ARNを保持するシーク AWS レットを指定します。シー AWS クレットをパラメータセット内で使用できるようにするには、 AmazonDataZoneDomain : [Domain_ID] タグでタグ付けする必要があります。

          既存の AWS シークレットがない場合は、新しいシークレットの作成 を選択して新しい AWS シークレットを作成することもできます。これにより、シークレットの名前、ユーザー名、パスワードを指定できるダイアログボックスが開きます。新しい AWS シークレットの作成 を選択すると、Amazon は AWS Secrets Manager サービスに新しいシークレット DataZone を作成し、パラメータセットを作成しようとしているドメインでシークレットにタグが付けられていることを確認します。

        • 環境の作成時に使用する Amazon Redshift ワークグループを指定します。

        • 環境の作成時に使用するデータベースの名前 (選択したワークグループ内) を指定します。

      • AWS Glue のみ + Amazon Redshift クラスター

        • 選択した Amazon Redshift クラスターの認証情報ARNを保持するシーク AWS レットを指定します。シー AWS クレットをパラメータセット内で使用できるようにするには、 AmazonDataZoneDomain : [Domain_ID] タグでタグ付けする必要があります。

          既存の AWS シークレットがない場合は、新しいシークレットの作成 を選択して新しい AWS シークレットを作成することもできます。これにより、シークレットの名前、ユーザー名、パスワードを指定できるダイアログボックスが開きます。新しい AWS シークレットの作成 を選択すると、Amazon は AWS Secrets Manager サービスに新しいシークレット DataZone を作成し、パラメータセットを作成しようとしているドメインでシークレットにタグが付けられていることを確認します。

        • 環境の作成時に使用する Amazon Redshift クラスターを指定します。

        • 環境の作成時に使用するデータベースの名前 (選択したクラスター内) を指定します。

  5. パラメータセットの作成 を選択します。