本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。
若要將 AWS Glue Data Catalog 連接到外部資料來源,您需要使用 AWS Glue 連線來啟用與外部資料來源的通訊。您可以使用 AWS Glue 主控台、建立連線 API 和 Amazon SageMaker Lakehouse 主控台來建立 AWS Glue 連線。 https://docs.aws.amazon.com/glue/latest/webapi/API_CreateConnection.html
如需建立 AWS Glue 連線的逐步說明,請參閱《 AWS Glue 開發人員指南》中的連線至資料或在 Amazon SageMaker Lakehouse 中建立連線。
當使用者在聯合資料表上執行查詢時,Lake Formation 會轉譯 登入資料,以叫用 AWS Glue 連線中指定的 AWS Lambda 函數,從資料來源擷取中繼資料物件。
從外部資料來源建立聯合目錄並設定許可 (主控台)
-
開啟 Lake Formation 主控台,網址為 https://console.aws.amazon.com/lakeformation/
。 在導覽窗格中,選擇 Data Catalog 下的目錄。
選取建立目錄選項。
在設定目錄詳細資訊頁面上,輸入下列資訊:
-
名稱 – 聯合目錄的唯一名稱。名稱無法變更,且必須位於小寫。名稱最多可包含 255 個字元。 帳戶。
-
類型 – 選擇聯合型目錄做為目錄類型。
-
來源 – 從下拉式清單中選擇資料來源。您已建立連線的資料來源隨即顯示。如需建立外部資料來源 AWS Glue 連線的詳細資訊,請參閱《 AWS Glue 開發人員指南》中的建立連接器的連線或在 Amazon SageMaker Lakehouse 中建立連線。
-
連線 – 選擇現有的資料來源 AWS Glue 連線。
-
描述 – 輸入從資料來源建立之目錄的描述。
-
-
選擇 Lake Formation 的 IAM 角色,以擔任 vend 憑證,讓查詢引擎從資料來源存取資料。此角色必須具備必要的許可,才能存取 AWS Glue 連線並叫用 Lambda 函數,才能從外部資料來源存取資料。
您也可以在 IAM 主控台中建立新的角色。
如需必要的許可,請參閱將 Data Catalog 連接到外部資料來源的先決條件一節。
-
選取 選項 啟用連接器以連線至資料來源,讓 Athena 執行聯合查詢。
如需支援的連接器清單,請參閱《Amazon Athena 使用者指南》中的註冊連線。
-
加密選項 – 如果您想要使用自訂金鑰來加密目錄,請選擇自訂加密設定選項。若要使用自訂金鑰,您必須將其他自訂受管金鑰政策新增至 KMS 金鑰。
選擇下一步,將許可授予其他主體。
在授予許可頁面上,選擇新增許可。
-
在新增許可畫面上,選擇要授予的主體和許可類型。
-
在主體區段中,選擇主體類型,然後指定要授予許可的主體。
-
IAM 使用者和角色 – 從 IAM 使用者和角色清單中選擇一或多個使用者或角色。
-
SAML 使用者和群組 – 針對 SAML 和 Amazon QuickSight 使用者和群組,輸入一或多個透過 SAML 聯合的使用者或群組的 Amazon Resource Name (ARNs),或 Amazon QuickSight 使用者或群組ARNs。在每個 ARN 之後按 Enter。
-
-
在許可區段中,選取許可和可授予的許可。
在目錄許可下,選取要授予的一或多個許可。
選擇超級使用者,授予目錄內所有資源不受限制的管理許可。
在可授予許可下,選取授予收件人可以授予其 AWS 帳戶中其他主體的許可。當您從外部帳戶將許可授予 IAM 主體時,不支援此選項。
-
-
選擇下一步以檢閱資訊並建立目錄。目錄清單顯示新的聯合目錄。
資料位置清單顯示新註冊的聯合連線。