在 Athena for Spark 中設定跨帳戶 AWS Glue 存取

本主題將說明如何將消費者帳戶 666666666666 和擁有者帳戶 999999999999 設定為跨帳户 AWS Glue 存取權。設定帳戶時，消費者帳戶可以在擁有者的 AWS Glue 資料庫和資料表上執行 Athena for Spark 的查詢。

步驟 1：在中 AWS Glue，提供取用者角色的存取權

在中 AWS Glue，擁有者會建立政策，讓消費者的角色存取擁有者 AWS Glue 的資料目錄。

在資料目錄設定頁面的許可區段中，新增如下政策。此政策為消費者帳戶 666666666666 提供存取所有者帳戶 999999999999 中的資料目錄的角色。

在取用者帳戶中，建立政策以允許存取擁有者 AWS Glue Data Catalog的、資料庫和資料表，並將政策連接至角色。下列範例會使用消費者帳戶 666666666666。

在政策編輯器中，輸入如下所示的 JSON 陳述式，允許對擁有者帳戶的資料目錄執行 AWS Glue 動作。

接下來，您可以在消費者帳戶中使用 IAM 主控台，將剛建立的政策連接到消費者帳戶用來存取擁有者資料目錄的 IAM 角色或角色。

在 Athena Spark 的請求者帳戶中，使用指定的角色，藉由建立筆記本或編輯目前工作階段來建立工作階段，以測試存取。設定工作階段屬性時，請指定下列其中一個：

當您編輯工作階段屬性時，請新增下列項目：


{ 
    "spark.hadoop.aws.glue.catalog.separator": "/" 
}

當您在儲存格中執行查詢時，請使用類似下列範例中的語法。請注意，在 FROM 子句中，資料庫名稱前需要目錄 ID 和分隔符號。


df = spark.sql('SELECT requestip, uri, method, status FROM `999999999999/mydatabase`.cloudfront_logs LIMIT 5') 
df.show()

當您編輯工作階段屬性時，請輸入下列屬性。將 999999999999 取代為擁有者帳戶 ID。


{ 
    "spark.hadoop.hive.metastore.glue.catalogid": "999999999999" 
}

當您在儲存格中執行查詢時，請使用如下語法。請注意，在 FROM 子句中，資料庫名稱前不需要目錄 ID 和分隔符號。


df = spark.sql('SELECT * FROM mydatabase.cloudfront_logs LIMIT 10') 
df.show()

您的瀏覽器已停用或無法使用 Javascript。

您必須啟用 Javascript，才能使用 AWS 文件。請參閱您的瀏覽器說明頁以取得說明。

啟用 Spark 加密

Service Quotas