翻訳は機械翻訳により提供されています。提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。
ステップ 4: Delta Lake テーブルのアクセス許可をセットアップする
このセクションでは、 でシンボリックリンクマニフェストファイルを使用して Delta Lake テーブルを作成し、 でデータ許可を設定し AWS Glue Data Catalog、Amazon Athena を使用してデータを AWS Lake Formation クエリする方法について説明します。
Delta Lake テーブルを作成するには
このステップでは、Data Catalog に Delta Lake トランザクションテーブルを作成する AWS Glue ジョブを実行します。
-
米国東部 (バージニア北部) リージョンの https://console.aws.amazon.com/glue/
でAWS Glueコンソールにサインインします。 データレイク管理ユーザーとして開きます。
-
左側のナビゲーションペインで、[ジョブ] を選択します。
-
native-delta-create
を選択します。 -
[アクション] で [ジョブの編集] を選択します。
-
ジョブの詳細 で高度なプロパティ を展開し、Hive メタストア AWS Glue Data Catalog として使用 の横にあるチェックボックスをオンにして、 にテーブルメタデータを追加します AWS Glue Data Catalog。これは、ジョブで使用される Data Catalog リソースのメタストア AWS Glue Data Catalog として を指定し、後で Lake Formation 許可をカタログリソースに適用できるようにします。
[保存] を選択します。
-
[アクション] で [実行] を選択します。
このジョブは、
lfdeltadb
データベースにproduct
という名前を付けた Delta Lake テーブルを作成します。Lake Formation コンソールのproduct
テーブルを確認してください。
データロケーションを Lake Formation に登録するには
次に、Amazon S3 パスをデータレイクのルートロケーションとして登録します。
-
Lake Formation コンソール (https://console.aws.amazon.com/lakeformation/
) をデータレイク管理者ユーザーとして開きます。 ナビゲーションペインの [登録および取り込み] で [データレイクのロケーション] を選択します。
コンソールの右上で、[ロケーションを登録] を選択します。
[ロケーションを登録] ページで、次のように入力します。
-
[Amazon S3 パス] – [ブラウズ] を選択して
lf-otf-datalake-123456789012
を選択します。Amazon S3 ルートロケーションの横にある右矢印 (>) をクリックして、s3/buckets/lf-otf-datalake-123456789012/transactionaldata/native-delta
ロケーションに移動します。 -
[IAM ロール] – IAM ロールとして
LF-OTF-RegisterRole
を選択します。 [Register location] (ロケーションを登録) を選択します。
-
Delta Lake テーブルでデータレイクのアクセス許可を付与するには
このステップでは、ビジネスアナリストユーザーにデータレイクのアクセス許可を付与します。
[データレイクのアクセス許可] で、[付与] を選択します。
[データのアクセス許可の付与] 画面で、[IAM ユーザーとロール] を選択します。
-
ドロップダウンから
lf-consumer-analystuser
。 [名前付きのデータカタログリソース] を選択します。
[データベース] には
lfdeltadb
を選択します。[Tables] (テーブル) には
product
を選択します。次に、列を指定して列ベースのアクセスを許可できます。
[テーブル許可] には [選択] を選択します。
[データのアクセス許可] で [列ベースのアクセス] を選択し、[列を含める] を選択します。
product_name
、price
、category
列を選択します。[Grant] (付与) を選択します。
Athena を使用した Delta Lake テーブルをクエリするには
ここで Athena を使用し、作成した Delta Lake テーブルに対するクエリを開始します。Athena でクエリを初めて実行する場合は、クエリ結果の場所を設定する必要があります。詳細については、「クエリ結果の場所の指定」を参照してください。
データレイク管理者ユーザーとしてログアウトし、 AWS CloudFormation 出力から前述のパスワードを使用して、米国東部 (バージニア北部) リージョン
BusinessAnalystUser
で としてログインします。https://console.aws.amazon.com/athena/
で Athena コンソールを開きます。 [設定] を選択し、[管理] を選択します。
クエリ結果の場所 ボックスに、 AWS CloudFormation 出力で作成したバケットへのパスを入力します。
AthenaQueryResultLocation
(s3://lf-otf-tutorial-123456789012/athena-results/) の値をコピーし、 を保存します。次のクエリを実行して、Delta Lake テーブルに保存されている 10 個のレコードをプレビューします。
select * from lfdeltadb.product limit 10;
Delta Lake テーブルをクエリする方法の詳細については、「Amazon Athena ユーザーガイド」の「Delta Lake テーブルのクエリ」を参照してください。