メタデータテーブルのクエリ - Amazon Simple Storage Service

メタデータテーブルのクエリ

Amazon S3 Metadata テーブルは、表形式データ用に最適化されたストレージを提供する AWS マネージド S3 テーブルバケットに保存されます。メタデータをクエリするために、テーブルバケットを Amazon SageMaker Lakehouse と統合できます。AWS Glue Data Catalog および AWS Lake Formation を使用するこの統合により、AWS 分析サービスがテーブルデータを自動的に検出してアクセスできるようになります。

テーブルバケットが AWS Glue Data Catalog と統合されると、Amazon Athena、Amazon EMR、Amazon Redshift などの AWS 分析サービスを使用してメタデータテーブルを直接クエリできます。そこから、Amazon QuickSight を使用して、クエリデータでインタラクティブなダッシュボードを作成できます。

AWS マネージド S3 テーブルバケットと Amazon SageMaker Lakehouse の統合の詳細については、「Amazon S3 Tables と AWS 分析サービスの統合」を参照してください。

AWS Glue Iceberg REST エンドポイント、Amazon S3 Tables Iceberg REST エンドポイント、または Apache Iceberg クライアントカタログの Amazon S3 Tables Catalog を使用して、Apache Spark、Apache Trino、および Apache Iceberg 形式をサポートする他のアプリケーションでメタデータテーブルをクエリすることもできます。メタデータテーブルへのアクセスの詳細については、「テーブルデータへのアクセス」を参照してください。

Apache Iceberg 形式をサポートする任意のクエリエンジンを使用してメタデータテーブルを分析することもできます。例えば、メタデータテーブルをクエリして、以下を実行できます。

  • ストレージの使用パターンと傾向を確認する

  • オブジェクト全体の AWS Key Management Service (AWS KMS) 暗号化キーの使用状況を監査する

  • ユーザー定義メタデータとオブジェクトタグでオブジェクトを検索する

  • オブジェクトメタデータの経時的な変化を理解する

  • リクエストを行った AWS アカウント ID や IP アドレスなど、オブジェクトがいつ更新または削除されたかを知る

S3 マネージドメタデータテーブルとカスタムメタデータテーブルを結合して、複数のデータセット間でクエリを実行することもできます。

クエリ料金に関する考慮事項

メタデータテーブルでクエリを実行する場合は、追加料金が適用されます。詳細については、使用しているクエリエンジンの料金情報を参照してください。

クエリのコスト効率を高める方法については、「メタデータテーブルのクエリパフォーマンスの最適化」を参照してください。