Amazon S3 Tables 與 AWS 分析服務整合概觀 - Amazon Simple Storage Service

本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。

Amazon S3 Tables 與 AWS 分析服務整合概觀

若要讓 AWS 分析服務可存取您帳戶中的資料表,您可以將 Amazon S3 資料表儲存貯體與 Amazon SageMaker Lakehouse 整合。此整合可讓 AWS 分析服務自動探索和存取您的資料表資料。您可以使用此整合來使用這些服務中的資料表:

注意

此整合使用 AWS Glue 和 AWS Lake Formation 服務,並可能產生 AWS Glue 請求和儲存成本。如需詳細資訊,請參閱AWS Glue 定價

在 S3 資料表上執行查詢則採用另外的定價。如需詳細資訊,請參閱您正在使用的查詢引擎定價資訊。

整合的運作方式

當您在主控台中建立資料表儲存貯體時,Amazon S3 會啟動下列動作,以整合您所選區域中的資料表儲存貯體與 AWS 分析服務:

  1. 建立新的 AWS Identity and Access Management (IAM) 服務角色,讓 Lake Formation 存取您所有的資料表儲存貯體。

  2. Lake Formation 會使用服務角色,在目前區域中註冊資料表儲存貯體。這可讓 Lake Formation 管理該區域中所有目前和未來資料表儲存貯體的存取、許可和管控。

  3. s3tablescatalog目錄新增至目前區域中 AWS Glue Data Catalog 的 。新增s3tablescatalog目錄可讓所有資料表儲存貯體、命名空間和資料表填入資料目錄。

注意

這些動作會透過 Amazon S3 主控台自動化。如果您以程式設計方式執行此整合,則必須手動執行所有這些動作。

每個 AWS 區域整合資料表儲存貯體一次。整合完成後,所有目前和未來的資料表儲存貯體、命名空間和資料表都會新增至該區域中 AWS Glue Data Catalog 的 。

下圖顯示s3tablescatalog目錄如何自動填入目前區域中的資料表儲存貯體、命名空間和資料表,做為 Data Catalog 中的對應物件。資料表儲存貯體會填入為子目錄。資料表儲存貯體中的命名空間會填入其個別子目錄中的資料庫。資料表會作為其個別資料庫中的資料表填入。

資料表資源的呈現方式 AWS Glue Data Catalog。
許可的運作方式

我們建議您整合資料表儲存貯體與 AWS 分析服務,以便跨使用 AWS Glue Data Catalog 做為中繼資料存放區的服務使用資料表資料。整合可透過 啟用精細存取控制 AWS Lake Formation。此安全方法表示,除了 AWS Identity and Access Management (IAM) 許可之外,您還必須在資料表上授予 IAM 主體 Lake Formation 許可,才能使用這些許可。

中有兩種主要類型的許可 AWS Lake Formation:

  • 中繼資料存取許可控制在 Data Catalog 中建立、讀取、更新和刪除中繼資料資料庫和資料表的能力。

  • 基礎資料存取許可可控制將資料讀取和寫入資料目錄資源指向的基礎 Amazon S3 位置的能力。

Lake Formation 使用自己的許可模型和 IAM 許可模型的組合來控制對 Data Catalog 資源和基礎資料的存取:

  • 若要請求存取 Data Catalog 資源或基礎資料以成功,請求必須通過 IAM 和 Lake Formation 的許可檢查。

  • IAM 許可控制對 Lake Formation 和 AWS Glue APIs存取,而 Lake Formation 許可控制對 Data Catalog 資源、Amazon S3 位置和基礎資料的存取。

Lake Formation 許可僅適用於授予許可的區域中,且委託人必須由資料湖管理員或其他具有必要許可的委託人授權,才能授予 Lake Formation 許可。

如需詳細資訊,請參閱《AWS Lake Formation 開發人員指南》中的 Lake Formation 許可概觀

請務必遵循 中的步驟,將 S3 Tables 與 AWS 分析服務整合以便您擁有適當的許可來存取 AWS Glue Data Catalog 和資料表資源,以及使用 AWS 分析服務。

後續步驟