使用 Amazon Athena SQL 處理 Apache Iceberg 資料表

Amazon Athena 提供 Apache Iceberg 的內建支援，不需要額外的步驟或組態。本節提供使用 Athena 與 Iceberg 資料表互動的支援功能和高階指引的詳細概觀。

版本和功能相容性

Iceberg 資料表規格支援

Apache Iceberg 資料表規格指定 Iceberg 資料表的行為。Athena 支援資料表格式第 2 版，因此您使用主控台、CLI 或 SDK 建立的任何 Iceberg 資料表本質上都會使用該版本。

如果您使用與另一個引擎建立的 Iceberg 資料表，例如 Amazon EMR 上的 Apache Spark，或者 AWS Glue，請務必使用資料表屬性來設定資料表格式版本。做為參考，請參閱本指南稍早的建立和撰寫 Iceberg 資料表一節。

Iceberg 功能支援

您可以使用 Athena 從 Iceberg 資料表讀取和寫入。當您使用 UPDATE、 MERGE INTO和 DELETE FROM陳述式變更資料時，Athena 僅支援merge-on-read模式。此屬性無法變更。若要使用copy-on-write更新或刪除資料，您必須使用其他引擎，例如 Amazon EMR 上的 Apache Spark 或 AWS Glue。下表摘要說明 Athena 中的 Iceberg 功能支援。

		DDL 支援		DML 支援		AWS Lake Formation 安全（選用）
	資料表格式	建立資料表	結構描述演進	讀取資料	寫入資料	資料列/資料欄存取控制
Amazon Athena	2 版	✓	✓	✓	XCopy-on-write	✓
Amazon Athena	2 版	✓	✓	✓	✓Merge-on-read	✓

注意

Athena 不支援增量查詢。
在 Athena 中，更新、刪除和合併操作一律預設為在讀取時合併 (MoR)，無論資料表屬性中的任何寫入時複製 (CoW) 設定為何，因為不支援 CoW。

使用 Iceberg 資料表

如需在 Athena 中使用 Iceberg 的快速入門，請參閱本指南稍早在 Athena SQL 中開始使用 Iceberg 資料表一節。

下表列出限制和建議。

情況	限制	建議
資料表 DDL 產生	使用其他引擎建立的 Iceberg 資料表可以具有未在 Athena 中公開的屬性。對於這些資料表，無法產生 DDL。	在建立資料表的引擎中使用對等陳述式（例如 Spark 的 `SHOW CREATE TABLE` 陳述式）。
寫入 Iceberg 資料表之物件中的隨機 Amazon S3 字首	根據預設，使用 Athena 建立的 Iceberg 資料表已啟用 `write.object-storage.enabled` 屬性。	若要停用此行為並完全控制 Iceberg 資料表屬性，請使用另一個引擎建立 Iceberg 資料表，例如 Amazon EMR 上的 Spark 或 AWS Glue。
增量查詢	Athena 目前不支援。	若要使用增量查詢來啟用增量資料擷取管道，請在 Amazon EMR 或上使用 Spark AWS Glue。

您的瀏覽器已停用或無法使用 Javascript。

您必須啟用 Javascript，才能使用 AWS 文件。請參閱您的瀏覽器說明頁以取得說明。

文件慣用形式

使用 Firehose 處理 Iceberg 資料表

將現有資料表遷移至 Iceberg