本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。
步驟 4:設定三角洲湖資料表的權限
在本節中,您將學習如何使用 Amazon Athena 建立具有符號連結資訊清單檔案的 Delta Lake 資料表 AWS Glue Data Catalog、在中設定資料許可,以 AWS Lake Formation 及如何使用 Amazon Athena 查詢資料。
建立三角洲湖表格的步驟
在此步驟中,您將執行在「資料目錄」中建立 Delta Lake 交易資料表的 AWS Glue 工作。
-
在美國東部 (維吉尼亞北部) 區域的 https://console.aws.amazon.com/glue/
登入AWS Glue主控台 以資料湖管理員使用者身分。
-
從左側導覽窗格中選擇工作。
-
選取
native-delta-create
。 -
在「動作」 下選擇「編輯工作」。
-
在 [Job 詳細資料] 下,展開 [進階屬性],然後核取 [用 AWS Glue Data Catalog 作 Hive 中繼資料庫] 旁邊的方塊,以在中新增表格中 AWS Glue Data Catalog繼資料。這會指定 AWS Glue Data Catalog 為工作中使用之資料目錄資源的中繼儲存區,並允許稍後在目錄資源上套用 Lake Formation 權限。
選擇儲存。
-
選擇動作下的執行。
此工作會建立資料庫
product
中名為的 Delta Lake 資lfdeltadb
料表。驗證 Lake Formation 控制台中的product
表格。
向 Lake Formation 註冊資料位置
接下來,將 Amazon S3 路徑註冊為資料湖的根位置。
-
在 https://console.aws.amazon.com/lakeformation/
開啟資料湖管理員使用者的湖泊形成主控台。 在功能窗格的 [註冊並擷取] 下,選擇 [資料位置]。
選擇主機右上角的 [註冊位置]。
在 [註冊位置] 頁面上,輸入下列資訊:
-
Amazon S3 路徑 — 選擇瀏覽並選取
lf-otf-datalake-123456789012
。按一下 Amazon S3 根位置旁的向右箭頭 (>) 以導覽至該s3/buckets/lf-otf-datalake-123456789012/transactionaldata/native-delta
位置。 -
IAM 角色 — 選擇
LF-OTF-RegisterRole
做為 IAM 角色。 選擇註冊地點。
-
授與 Delta 湖表格上的資料湖權限
在此步驟中,我們將授與資料湖權限給業務分析師使用者。
在 [資料湖權限] 下,選擇 [授與]。
在「授予資料權限」畫面上,選擇 IAM 使用者和角色。
-
lf-consumer-analystuser
從下拉菜單。 選擇具名資料目錄資源。
對於數據庫,選擇
lfdeltadb
。對於「表格」,請選擇
product
。接下來,您可以指定資料行來授與以資料行為基礎的存取權。
在 [資料表權限] 下,選擇 [選取
在 [資料權限] 底下,選擇 [以欄為基礎的存取],選擇 [包含欄
選擇
product_name
price
、和category
欄。選擇 Grant (授予)。
使用 Athena 查詢三角洲湖表
現在開始查詢您使用 Athena 建立的三角洲湖資料表。如果這是您第一次在 Athena 執行查詢,則需要設定查詢結果位置。如需詳細資訊,請參閱指定查詢結果位置。
以資料湖管理員使用者身分登出,並使用先前 AWS CloudFormation 輸出
BusinessAnalystUser
中提到的密碼在美國東部 (維吉尼亞北部) 區域登入。前往 https://console.aws.amazon.com/athena/
開啟 Athena 主控台。 選擇設定,然後選取管理。
在查詢結果的位置方塊中,輸入您在 AWS CloudFormation 輸出中建立的值區的路徑。複製的值
AthenaQueryResultLocation
(3://lf-otf-tutorial-123456789012 /雅典音結果/)並保存。執行下列查詢以預覽 Delta Lake 資料表中儲存的 10 筆記錄:
select * from lfdeltadb.product limit 10;
如需查詢三角洲湖資料表的詳細資訊,請參閱 Amazon Athena 使用者指南中的查詢三角洲湖資料表一節。