翻訳は機械翻訳により提供されています。提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。
Apache Iceberg テーブルの作成
AWS Lake Formation は、Amazon S3 に AWS Glue Data Catalog データが存在する で Apache Parquet データ形式を使用する Apache Iceberg テーブルの作成をサポートします。Data Catalog のテーブルは、データストア内のデータを表すメタデータ定義です。デフォルトでは、Lake Formation は Iceberg v2 テーブルを作成します。v1 テーブルと v2 テーブルの違いについては、Apache Iceberg ドキュメントの「形式バージョンの変更
Apache Iceberg
Lake Formation コンソールまたは の AWS Glue API CreateTable
オペレーションを使用して、データカタログに Iceberg テーブルを作成できます。詳細については、CreateTable 「 アクション (Python: create_table)」を参照してください。
Data Catalog に Iceberg テーブルを作成する場合、読み取りと書き込みを実行できるように、Amazon S3 でテーブル形式とメタデータファイルのパスを指定する必要があります。
Lake Formation を使用して、Amazon S3 データロケーションを に登録するときに、きめ細かなアクセスコントロールアクセス許可を使用して Iceberg テーブルを保護することができます AWS Lake Formation。Amazon S3 のソースデータおよび Lake Formation に登録されていないメタデータの場合、アクセスは Amazon S3 のIAMアクセス許可ポリシーと AWS Glue アクションによって決まります。詳細については、「Lake Formation 許可の管理」を参照してください。
注記
Data Catalog は、パーティションの作成と Iceberg テーブルプロパティの追加をサポートしていません。
前提条件
Data Catalog に Iceberg テーブルを作成し、Lake Formation のデータアクセス許可を設定するには、次の要件を満たす必要があります。
-
Lake Formation にデータが登録されていない状態で Iceberg テーブルを作成するために必要なアクセス許可。
Data Catalog にテーブルを作成するために必要なアクセス許可に加えて、テーブル作成者には次のアクセス許可が必要です。
s3:PutObject
リソース arn:aws:s3::{bucketName}-
s3:GetObject
リソース arn:aws:s3::{bucketName} -
s3:DeleteObject
リソース arn:aws:s3::{bucketName}
-
Lake Formation にデータが登録されている状態で Iceberg テーブルを作成するために必要なアクセス許可:
Lake Formation を使用してデータレイク内のデータを管理および保護するには、テーブルのデータを含む Amazon S3 ロケーションを Lake Formation に登録します。これは、Lake Formation が Athena、Redshift Spectrum、Amazon などの AWS 分析サービスに認証情報を公開EMRしてデータにアクセスできるようにするためです。Amazon S3 ロケーションの登録の詳細については「データレイクへの Amazon S3 ロケーションの追加」を参照してください。
Lake Formation に登録されている、基盤となるデータを読み書きするプリンシパルには、次のアクセス許可が必要です。
-
lakeformation:GetDataAccess
-
DATA_LOCATION_ACCESS
ロケーションに対するデータロケーション許可を持つプリンシパルは、すべての子ロケーションに対するロケーション許可も持っています。
データロケーション許可の詳細については、「基盤となるデータのアクセスコントロール」を参照してください。
-
圧縮を有効にするには、サービスが Data Catalog のテーブルを更新するアクセス許可を持つIAMロールを引き受ける必要があります。詳細については、「テーブル最適化の前提条件」を参照してください。
Iceberg テーブルの作成
Iceberg v1 および v2 テーブルは、Lake Formation コンソールを使用するか、このページに記載されている AWS Command Line Interface ように作成できます。 AWS Glue コンソールまたは を使用して Iceberg テーブルを作成することもできます AWS Glue クローラー。詳細については、「 AWS Glue デベロッパーガイド」の「Data Catalog とクローラー」を参照してください。
Iceberg テーブルを作成するには