版本備註 - Amazon Athena

本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。

版本備註

依發行日期描述 Amazon Athena 功能、改善項目和錯誤修正。

Athena 2024 年發行公告

2024年2月15日

發佈於 2 月 15 日

Athena 發布 JDBC 驅動程序版本 3.1.0。

Amazon Athena JDBC 驅動程序 3.1.0 版增加了對 Microsoft 活動目錄聯合服務(AD FS)視窗集成身份驗證和基於表單的身份驗證的支持。3.1.0 版本還包括其他小改進和錯誤修復。

若要下載 JDBC v3 驅動程式,請參閱JDBC 3.x 驅動程式下載

2024 年 1 月 31 日

發佈於二零二一年一月三十一

Athena 發布了下列功能以及強化功能。

2023 年 Athena 版本備註

2023 年 12 月 14 日

2023-12-14 發布者

Athena 發布下列修復和改善。

Athena 發布了 JDBC 驅動程式 2.1.3 版。驅動程式可解決下列問題:

  • 改進了日誌記錄,以避免與 Spring Boot 和 Gradle 應用程式日誌記錄發生衝突。

  • 當使用 executeBatch() JDBC 方法插入記錄時,驅動程式錯誤地只插入一則記錄。由於 Athena 不支援批次執行查詢,驅動程式現在會在您使用 executeBatch() 時報告錯誤。若要解決該限制,您可在迴圈中提交單一查詢。

若要下載新的 JDBC 驅動程式、版本備註和文件,請參閱 Athena JDBC 2.x 驅動程式

2023 年 12 月 9 日

2023-12-09 發布

發布了適用於 Athena 的 ODBC 1.2.1.1000 驅動程式。

功能和增強功能:

  • 更新了 RStudio 支援 – ODBC 驅動程式現在支援 macOS 上的 RStudio。

  • 單一型錄和結構描述支援 – 連接器現在可以傳回單一型錄和結構描述。如需詳細資訊,請參閱可下載的安裝和設定指南。

解決的問題︰

  • 準備好的陳述式 – 執行含有參數陣列 (使用欄式結構描述) 的準備好的陳述式時,連接器會傳回不正確的查詢結果。

  • 資料欄大小 – 選取 $file_modified_time 系統資料欄時,連接器傳回不正確的資料欄大小。

  • SQL 準備 – 繫結與 SELECT 查詢中 SQLPrepare 相關的參數時,連接器會傳回錯誤。

如需詳細資訊並下載新的驅動程式、版本備註和文件,請參閱Athena ODBC 1.x 驅動程式

2023 年 12 月 7 日

2023-12-07 發布

Athena 宣佈推出 ODBC 驅動程式 2.0.2.1. 版。如需詳細資訊,請參閱 2.0.2.1 版本備註。若要下載新的 ODBC v2 驅動程式,請參閱 ODBC 2.x 驅動程式下載。如需連線資訊,請參閱 設定 Amazon Athena ODBC 2.x 連線

2023 年 12 月 5 日

2023-12-05 發布

您現在可以建立使用 AWS IAM Identity Center 驗證模式的 Athena SQL 工作群組。這些工作群組支援 IAM Identity Center 的受信任身分傳播功能。受信任的身分傳播允許在 Amazon 雅典娜和亞馬遜 EMR 工作室等 AWS 分析服務中使用身分。

如需詳細資訊,請參閱 使用啟用 IAM Identity Center 的 Athena 工作群組

2023 年 11 月 28 日

2023-11-28 發布

您現在可在Amazon S3 Express 單區域儲存類別中查詢資料,以獲取快速查詢結果。S3 Express One Zone 是一種高效能的單一可用區域儲存類別,專門針對最常存取的資料和延遲敏感的應用程式,提供一致、延遲不到 10 毫秒的資料存取。若要開始使用,請使用 AWS Glue Data Catalog 將您的資料移至 S3 Express 單區域儲存並編目資料,以便在 Athena 中提供無縫的查詢體驗。

如需詳細資訊,請參閱 查詢 S3 Express 單區域資料

2023 年 11 月 27 日

2023-11-27 發布

Athena 發布了下列功能以及強化功能。

  • Glue 資料目錄檢視 — Glue 資料目錄檢視提供跨 AWS 服務的單一通用檢視,例如 Amazon Athena 和 Amazon Redshift。在 Glue Data Catalog 檢視中,存取許可由建立檢視的使用者定義,而不是查詢檢視的使用者。這些檢視提供更大的存取控制權、協助確保完整的記錄、提供增強的安全性,以及防止存取基礎資料表。

    如需詳細資訊,請參閱 使用 AWS Glue Data Catalog 檢視

  • CloudTrail 湖泊支援 — 您現在可以使用 Amazon Athena 分析AWS CloudTrail 湖泊中的資料。 AWS CloudTrail Lake 是受管理的資料湖,您 CloudTrail 可以用來彙總、不變化的儲存和分析活動記錄,以進行稽核、安全性和作業調查。若要從 Athena 查詢 CloudTrail Lake 活動記錄,您不需要移動資料或建立個別的資料處理管道。無需 ETL 操作。

    若要開始使用,請在 CloudTrail Lake 中啟用資料聯合。當您與之共用 CloudTrail Lake 事件資料存放區中繼資料時 AWS Glue Data Catalog, CloudTrail 會建立必要的 AWS Glue Data Catalog 資源並向其註冊資料 AWS Lake Formation。在 Lake Formation 中,您可以指定可使用 Athena 查詢事件資料儲存的使用者和角色。

    如需詳細資訊,請參閱《AWS CloudTrail 使用者指南》中的啟用 Lake 查詢聯合

2023 年 11 月 17 日

2023-11-17 發布

Athena 發布了下列功能以及強化功能。

功能

  • 成本為基礎的最佳化工具 — Athena 宣布使用來自的統計資料正式推出成本 AWS Glue若要最佳化 Athena SQL 中的查詢,您可以請求 Athena 為 AWS Glue中的資料表收集資料表或資料欄層級的統計資訊。如果查詢中的所有資料表都有統計資訊,Athena 會使用這些統計資訊來檢查替代的執行計畫,並選取可能速度最快的執行計畫。

    如需詳細資訊,請參閱 使用成本型最佳化工具

  • Amazon EMR Studio 整合 – 您現在可以在 Amazon EMR Studio 中直接使用 Athena,而無需使用 Athena 主控台。您可以使用 Amazon EMR 中的 Athena 整合進行下列任務:

    • 進行 Athena SQL 查詢

    • 檢視查詢結果

    • 檢視查詢歷史記錄

    • 檢視儲存的查詢

    • 進行參數化查詢

    • 檢視資料目錄的資料庫、資料表和檢視

    如需詳細資訊,請參閱 使用 Athena 的 AWS 服務 整合 主題中的 Amazon EMR Studio

  • 巢狀存取控制 – Athena 宣布支援針對巢狀資料的 Lake Formation 存取控制。在 Lake Formation 中,您可以在具有 struct 資料類型的巢狀資料欄上定義和套用資料篩選條件。您可以使用資料篩選來限制使用者對巢狀資料欄子結構的存取。如需有關如何為巢狀資料建立資料篩選條件的資訊,請參閱《AWS Lake Formation 開發人員指南》中的建立資料篩選條件

  • 佈建的容量使用量指標 — Athena 宣布容量保留的新 CloudWatch 指標。您可以使用新指標來追蹤已佈建的 DPU 數目以及查詢所使用的 DPU 數目。查詢完成後,您也可以檢視查詢所使用的 DPU 數目。

    如需詳細資訊,請參閱 使用 CloudWatch 指標監控 Athena 查詢

改善項目

  • 錯誤訊息變更Insufficient Lake Formation permissions 錯誤訊息現在會讀取 Table not foundSchema not found。此變更是為了防止惡意行為者從錯誤訊息推斷出資料表或資料庫資源的存在。

2023 年 11 月 16 日

2023-11-16 發布

Athena 發布了新的 JDBC 驅動程式,可改善從相容 SQL 開發和商業智慧應用程式連線、查詢和視覺化資料的體驗。新驅動程式很容易升級。該驅動程式可以直接從 Amazon S3 讀取查詢結果,讓您更快取得查詢結果。

如需詳細資訊,請參閱 Athena JDBC 3.x 驅動程式

2023 年 10 月 31 日

2023-10-31 發布

Amazon Athena 宣布佈建容量的保留時間為 1 小時。從今天開始,您可以保留佈建的容量並在一小時後釋放。這項變更可讓您更輕鬆地針對需求隨時間變化的工作負載,實現成本最佳化。

佈建的容量是 Athena 的一項功能,可提供工作負載管理功能,協助您優先處理、控制和擴展最重要的互動式工作負載。您可以隨時新增容量以增加可同時執行的查詢數量、控制哪些工作負載使用該容量,以及在工作負載之間共用容量。

如需詳細資訊,請參閱 管理查詢處理容量。如需定價資訊,請造訪 Amazon Athena 定價頁面。

2023 年 10 月 25 日

2023-10-26 發布

Athena 發布了下列修復和改善。

jackson-core 套件 – 數值大於 1000 個字元的 JSON 文字現在會失敗。此項修復解決了安全性問題 sonatype-2022-6438

2023 年 10 月 17 日

2023-10-17 發布

Athena 宣布了 ODBC 驅動程式 2.0.2.0 版。如需詳細資訊,請參閱 2.0.2.0 版本備註。若要下載新的 ODBC v2 驅動程式,請參閱 ODBC 2.x 驅動程式下載。如需連線資訊,請參閱 設定 Amazon Athena ODBC 2.x 連線

2023 年 9 月 26 日

2023-09-26 發布

Athena 發布了下列功能以及改善項目。

2023 年 8 月 23 日

2023-08-23 發布

Amazon Athena 宣佈在以色列 (特拉維夫) 區域推出 Athena SQL。

如需每個項目中 AWS 服務 可用項目的完整清單 AWS 區域,請參閱按地區分類的AWS 服務

2023 年 8 月 10 日

2023-08-10 發布

Athena 發布下列修復和改善。

ODBC 驅動程式 2.0.1.1 版

Athena 宣佈了 ODBC 驅動程式 2.0.1.1 版。如需詳細資訊,請參閱 2.0.1.1 版本備註。若要下載新的 ODBC v2 驅動程式,請參閱 ODBC 2.x 驅動程式下載。如需連線資訊,請參閱 設定 Amazon Athena ODBC 2.x 連線

JDBC 驅動程式 2.1.1 版

Athena 發布了 JDBC 驅動程式 2.1.1 版。驅動程式可解決下列問題:

  • 使用包含規則表達式的陳述式建立資料表時發生的錯誤。

  • 造成 ApplicationName 連線參數套用不正確的問題。

若要下載新的 JDBC 驅動程式、版本備註和文件,請參閱 使用 JDBC 連接到 Amazon Athena

2023 年 7 月 31 日

2023-07-31 發布

Amazon Athena 宣佈在其他 AWS 區域推出 Athena SQL。

此版本擴展了 Athena SQL 的可用性,包括亞太區域 (海德拉巴)、亞太區域 (墨爾本)、歐洲 (西班牙) 和歐洲 (蘇黎世)。

如需每個項目中 AWS 服務 可用項目的完整清單 AWS 區域,請參閱按地區分類的AWS 服務

2023 年 7 月 27 日

2023-07-27 發布

Athena 發布谷歌 BigQuery 連接器版本 2023.30.1。此版本的連接器可減少查詢執行時間,並新增針對 BigQuery私有端點進行查詢的支援。

如需 Google BigQuery 連接器的相關資訊,請參閱Amazon Athena 谷歌 BigQuery 連。如需有關更新現有資料來源連接器的資訊,請參閱 更新資料來源連接器

2023 年 7 月 24 日

2023-07-24 發布

Athena 發布下列修復和改善。

  • 含聯集的查詢 – 改善含聯集的特定查詢的效能。

  • 聯結類型比較 – 修正了包含兩種不同類型之間比較的 JOIN 陳述式的潛在查詢失敗。

  • 巢狀資料欄上的子查詢 – 修正了當子查詢與巢狀資料欄相關聯時,與查詢失敗相關的問題。

  • Iceberg 檢視 – 修正了 Apache Iceberg 檢視中時間戳記欄精度的相容性問題。現在,無論資料欄是在 Athena 引擎版本 2 還是 Athena 引擎版本 3 上建立的,具有時間戳記欄的 Iceberg 檢視皆可讀取。

2023 年 7 月 20 日

2023-07-20 發布

Athena 發布了 JDBC 驅動程式 2.1.0 版。該驅動程式包含新的增強功能並解決了問題。

增強功能

下列 Jackson JSON 剖析器程式庫已升級:

  • jackson-annotations 2.15.2 (先前為 2.14.0)

  • jackson-core 2.15.2 (先前為 2.14.0)

  • jackson-databind 2.15.2 (先前為 2.14.0)

已解決問題

  • 修正使用 sql2o 程式庫時傳遞陣列參數的問題。

如需詳細資訊並下載新的驅動程式、版本備註和文件,請參閱使用 JDBC 連接到 Amazon Athena

2023 年 7 月 13 日

2023-09-19 發布

Athena 發布了下列功能以及強化功能。

  • EXPLAIN ANALYZE – 新增了對佇列、分析、規劃和執行期的支援至 EXPLAIN ANALYZE 輸出中。

  • EXPLAIN – 當查詢包含彙總時,EXPLAIN 輸出現在會顯示統計資訊。

  • 實木複合地板 SerDe-添加了該parquet.ignore.statistics屬性,以便在讀取 Parquet 數據時忽略處理統計信息。如需相關資訊,請參閱 忽略 Parquet 統計資料

如需 EXPLAINEXPLAIN ANALYZE 的更多相關資訊,請參閱 在 Athena 使用 EXPLAIN 和 EXPLAIN ANALYZE。如需有關鑲木地板蜂巢的更多資訊 SerDe,請參閱木地板 SerDe

2023 年 7 月 3 日

2023-07-25 發布

從 2023 年 7 月 3 日起,Athena 開始編輯記錄中 CloudTrail 的查詢字串。查詢字串現在的值為 ***OMITTED***。進行此變更是為了防止意外揭露可能包含敏感資訊的資料表名稱或篩選條件值。如果您先前依賴 CloudTrail 記錄檔來存取完整的查詢字串,建議您使用 Athena::GetQueryExecution API 並responseElements.queryExecutionId從記錄傳 CloudTrail 入的值。如需詳細資訊,請參閱 Amazon Athena API 參考中的GetQueryExecution動作。

2023 年 6 月 30 日

2023-06-30 發布

Athena 查詢編輯器現在支援預先輸入的程式碼建議,以獲得更快的查詢編寫體驗。您現在可以使用下列功能來編寫 SQL 查詢,提高精度和效率:

  • 當您輸入時,將會即時顯示關鍵字、本機變數、程式碼片段和目錄項目。

  • 當您輸入資料庫名稱或資料表名稱,並在其後加上一個點時,編輯器會輕鬆顯示可供選擇的資料表和資料欄清單。

  • 將滑鼠游標移至程式碼片段建議上時,該概要會顯示程式碼片段語法和用法的簡要概觀。

  • 為提高程式碼可讀性,關鍵字及其醒目提示規則也已更新,符合 Trino 和 Hive 的最新語法。

此功能預設為啟用。您可以在程式碼編輯器偏好設定中啟用或停用功能。

若要在 Athena 查詢編輯器中嘗試預先輸入的程式碼建議,請造訪 Athena 主控台:https://console.aws.amazon.com/athena/

2023 年 6 月 29 日

2023-06-29 發布

2023 年 6 月 28 日

2023-06-28 發布

您現在可以使用 Amazon Athena 查詢從 S3 Glacier Flexible Retrieval (舊稱 Glacier) 和 S3 Glacier Deep Archive Amazon S3 儲存類別中還原的物件。您可基於每個資料表設定此功能。此功能僅支援 Athena 引擎版本 3 上的 Apache Hive 資料表。

如需詳細資訊,請參閱 查詢還原的 Amazon S3 Glacier 物件

2023 年 6 月 12 日

2023-06-12 發布

Athena 發布下列修復和改善。

  • Parquet Reader 時間戳記 – 新增了對 Parquet Reader 讀取時間戳記為 bigint (millis) 的支援 此更新提供與 Athena 引擎版本 2 中相同的支援。

  • EXPLAIN ANALYZE – 新增實體輸入讀取時間至查詢統計資訊和 EXPLAIN ANALYZE 的輸出。如需 EXPLAIN ANALYZE 的資訊,請參閱「在 Athena 使用 EXPLAIN 和 EXPLAIN ANALYZE」。

  • INSERT – 改善使用 INSERT 寫入的資料表的查詢效能。如需 INSERT 的資訊,請參閱「INSERT INTO」。

  • Delta Lake 資料表 – 已修正 Delta Lake 資料表上 DROP TABLE 的問題,此問題可防止其在並行修改時完全被刪除。

2023 年 6 月 8 日

2023-06-08 發布

Amazon Athena for Apache Spark 發布了下列新版功能。

  • 支援自訂 Java 程式庫和組態 – 您現在可以在 Athena 中為 Apache Spark 工作階段使用您自己的 Java 套件和自訂組態。使用 Spark 屬性,透過 Athena 主控台、或 Athena API 指定.jar檔案、套件 AWS CLI或其他自訂組態。如需詳細資訊,請參閱 新增 JAR 檔案和自訂 Spark 組態

  • 支援 Apache Hudi、Apache Iceberg 和 Delta Lake 資料表 – Athena for Spark 現在支援 Apache Iceberg、Apache Hudi 和 Linux Foundation Delta Lake 開放原始碼資料湖儲存資料表格式。如需詳細資訊,請參閱 使用 Amazon Athena for Apache Spark 中的非 Hive 資料表格式 及在 Athena for Spark 中使用 Apache IcebergApache HudiLinux Foundation Delta Lake 資料表的個別主題。

  • Apache Spark 的加密支援 – 在 Athena for Spark 中,您現在可以對 Spark 節點之間傳輸中的資料以及 Spark 儲存在磁碟上的本機靜態資料啟用加密功能。若要啟用 Spark 加密,您可以使用 Athena 主控台 AWS CLI、或 Athena API。如需詳細資訊,請參閱 啟用 Apache Spark 加密

如需有關 Amazon Athena for Apache Spark 的詳細資訊,請參閱 在 Amazon Athena 使用 Apache Spark

2023 年 6 月 2 日

2023-06-02 發布

您現在可以刪除 Athena 中的容量保留,並使用 AWS CloudFormation 範本來指定 Athena 容量保留。

  • 刪除容量保留 – 您現在可以刪除 Athena 中已取消的容量保留。必須先取消保留,然後才可將其刪除。刪除容量保留會立即從您的帳戶中移除保留。已刪除的保留無法再參考,包括其 ARN。若要刪除保留,您可以使用 Athena 主控台或 Athena API。如需詳細資訊,請參閱刪除容量保留Amazon Athena 使用者指南DeleteCapacityReservationAmazon Athena API 參考中的。

  • 使用容量保留 AWS CloudFormation 範本 — 您現在可以使用 AWS CloudFormation 範本,使用AWS::Athena::CapacityReservation資源來指定 Athena 容量保留。如需詳細資訊,請參閱AWS CloudFormation 使用者指南CapacityReservation中的AWS:: Athena::

如需有關使用容量保留在 Athena 佈建容量的詳細資訊,請參閱 管理查詢處理容量

2023 年 5 月 25 日

2023-05-25 發布

Athena 已發布可改善聯合查詢效能的資料來源連接器更新。全新的下推最佳化和動態篩選功能,可在來源資料庫 (而非 Athena) 中執行更多作業。這些最佳化可降低查詢執行期和減少掃描的資料量。這些改進需要 Athena 引擎版本 3。

下列連接器已更新:

如需有關升級資料來源連接器的資訊,請參閱 更新資料來源連接器

2023 年 5 月 18 日

2023-05-18 發布

您現在可以用 AWS PrivateLink 於與 Amazon Athena 的 IPv6 入站連線。

Amazon Athena 已透過網際網路通訊協定第 6 版 (IPv6) 端點擴展對傳入連線的支援,以包括 AWS PrivateLink。 AWS PrivateLink 從今天開始,除了先前可用的公有 IPv6 端點之外,您還可以使用 Amazon Virtual Private Cloud (Amazon VPC) 安全且私密地連線到 Athena。

網際網路的快速成長正在耗盡網際網路通訊協定第 4 版 (IPv4) 地址的可用性。IPv6 數次增加可用地址數目,因此您不再需要管理 VPC 中重疊位址空間。在此版本中,您現在可以結合使用 IPv6 定址的優點與 AWS PrivateLink的安全與效能優勢。

若要以程式設計方式連線至 AWS 服務,您可以使用AWS CLIAWS SDK 來指定端點。如需服務端點和 Athena 服務端點的詳細資訊,請參閱 Amazon Web Services 一般參考 中的 AWS 服務端點Amazon Athena 端點和配額

2023 年 5 月 15 日

2023-05-15 發布

Athena 宣布針對 DynamoDB、 CloudWatch 日誌、 CloudWatch 指標和 CMDB 推出阿帕奇星火 DataSource V2 (DSV2) 連接器。 AWS 使用新的 DSV2 連接器,以使用 Spark 查詢這些資料來源。DSV2 連接器使用的參數與其對應的 Athena 聯合連接器使用的相同。DSV2 連接器會直接在 Spark 工作者上執行,且不需要您部署 Lambda 函數即可予以使用。

如需詳細資訊,請參閱 適用於 Apache Spark 的 Athena 資料來源連接器

2023 年 5 月 10 日

2023-05-10 發布

發行了 Athena 的 ODBC 1.1.20 驅動程式。

功能和增強功能:

  • Lake Formation 端點覆寫支援。

  • ADFS 身分驗證外掛程式具有用於設定依賴方值的新參數 (LoginToRP)。

  • AWS 程式庫更新。

錯誤修正:

  • SQLPrepare() 方法提交失敗時,準備好的陳述式解除配置失敗。

  • 將 C 類型轉換為 SQL 類型時,繫結預備陳述式參數時發生錯誤。

  • EXPLAINEXPLAIN ANALYZE 查詢使用 SQLPrepare()SQLExecute() 時,無法傳回資料。

如需詳細資訊並下載新的驅動程式、版本備註和文件,請參閱使用 ODBC 連接到 Amazon Athena

2023 年 5 月 8 日

2023-05-08 發布

Athena 發布下列修復和改善。

  • 更新了 Hudi 整合 – Athena 更新了其與 Apache Hudi 的整合。您現在可以使用 Athena 查詢 Hudi 0.12.2 資料表,且現在支援 Hudi 資料表的 Hudi 中繼資料清單。如需詳細資訊,請參閱 使用 Athena 查詢 Apache Hudi 資料集Hudi 中繼資料清單

  • 時間戳記轉換修正 – 將時間戳記轉換的處理修正為精確度較低的資料類型。先前,Athena 引擎第 3 版錯誤地將值四捨五入為目標類型,而不是在轉換期間予以截斷。

    下列範例說明了修正之前的不正確處理。

    範例 1:從時間戳記 (以微秒為單位) 轉換為毫秒

    範例資料

    A, 2020-06-10 15:55:23.383 B, 2020-06-10 15:55:23.382 C, 2020-06-10 15:55:23.383345 D, 2020-06-10 15:55:23.383945 E, 2020-06-10 15:55:23.383345734 F, 2020-06-10 15:55:23.383945278

    下列查詢會嘗試擷取符合特定值的時間戳記。

    SELECT * FROM table WHERE timestamps.col = timestamp'2020-06-10 15:55:23.383'

    此查詢已傳回下列結果。

    A, 2020-06-10 15:55:23.383 C, 2020-06-10 15:55:23.383 E, 2020-06-10 15:55:23.383

    在修正之前,Athena 沒有包含值 2020-06-10 15:55:23.3839452020-06-10 15:55:23.383945278,因為它們已四捨五入為 2020-06-10 15:55:23.384

    範例 2:從時間戳記轉換至最新

    下列查詢已傳回錯誤的結果。

    SELECT date(timestamp '2020-12-31 23:59:59.999')

    結果

    2021-01-01

    在修正之前,Athena 將值四捨五入,因此這一天有所進展。這些值現被截斷,而不是四捨五入。

2023 年 4 月 28 日

2023-04-28 發布

您現在可以 Amazon Athena 上的容量保留,以在完全受管的運算容量上執行 SQL 查詢。

佈建的容量可聽工作負載管理功能,協助您優先處理序、控制和擴展最重要的互動式工作負載。您可以隨時新增容量以增加可同時執行的查詢數量、控制哪些工作負載使用該容量,以及在工作負載之間共用容量。

如需詳細資訊,請參閱 管理查詢處理容量。如需定價資訊,請造訪 Amazon Athena 定價頁面。

2023 年 4 月 17 日

2023-04-17 發布

Athena 發佈 JDBC 驅動程式 2.0.36 版。該驅動程式包含新的功能並解決了問題。

新功能

  • 您現在可以搭配使用可自訂的依賴方識別符與 AD FS 身分驗證。

  • 您現在可以將使用連接器的應用程式名稱新增至使用者代理程式字串。

已解決問題

  • 修正使用 getSchema() 擷取不存在的結構描述時發生的錯誤。

如需詳細資訊並下載新的驅動程式、版本備註和文件,請參閱使用 JDBC 連接到 Amazon Athena

2023 年 4 月 14 日

2023-06-20 發布

Athena 發布下列修復和改善。

  • 當您將字串轉換為時間戳時,日期和時間或時區之間需要一個空格。如需詳細資訊,請參閱 從字串轉換為時間戳記時,日期和時間值之間需要的空格

  • 移除時間戳記精確度處理方式的重大變更。為了維持 Athena 引擎版本 2 和 Athena 引擎版本 3 之間的一致性,時間戳記精確度現在預設為毫秒 (而非微秒)。

  • Athena 現在會在執行查詢時持續強制執行查詢輸出儲存貯體的存取權。請確定執行StartQueryExecution動作的所有 IAM 主體都具有查詢輸出儲存貯體的 S3: GetBucketLocation 權限。

2023 年 4 月 4 日

2023-04-04 發布

您現已可用 Amazon Athena 來建立和查詢聯合資料來源上的檢視。使用單一聯合檢視來查詢多個外部資料表或資料子集。這樣可以簡化所需的 SQL,並讓您靈活地模糊化必須使用 SQL 來查詢資料的最終使用者的資料來源。

如需詳細資訊,請參閱 使用檢視執行聯合查詢

2023 年 3 月 30 日

2023-03-30 發布

Amazon Athena 宣佈在其他 AWS 區域推出 Amazon Athena for Apache Spark。

此版本擴展了 Amazon Athena for Apache Spark 的可用性,包括亞太區域 (孟買)、亞太區域 (新加坡)、亞太區域 (雪梨) 和歐洲 (法蘭克福)。

如需有關 Amazon Athena for Apache Spark 的詳細資訊,請參閱 在 Amazon Athena 使用 Apache Spark

2023 年 3 月 28 日

2023-03-28 發布

Athena 發布下列修復和改善。

  • GetQueryExecutionBatchGetQueryExecution Athena API 動作的回應中,新 subStatementType 欄位會顯示執行的查詢類型 (例如 SELECTINSERTUNLOADCREATE_TABLECREATE_TABLE_AS_SELECT)。

  • 已修正 Apache Hive 寫入作業未正確加密資訊清單檔案的錯誤。

  • Athena 引擎版本 3 現在可以正確處理 approx_percentile 函數中的 NaNInfinity 值。approx_percentile 函數會傳回給定百分比的資料集的近似百分位數。

    Athena 引擎版本 2 錯誤地將 NaN 視為大於 Infinity 的值。Athena 引擎版本 3 現在會根據其他分析和統計函數中度這些值的處理方式來處理 NaNInfinity。以下幾點更詳細地說明了新行為。

    • 如果 NaN 在資料集中存在,則 Athena 會傳回 NaN

    • 如果 NaN 不存在,但 Infinity 存在,Athena 會將 Infinity 視為一個非常大的數值。

    • 如果存在多個 Infinity 值,Athena 會將它們視為相同的非常大的數值。如有必要,Athena 會輸出 Infinity

    • 如果單一資料集同時具有 Infinity-Double.MAX_VALUE,且百分位數結果為 -Double.MAX_VALUE,Athena 便會傳回 -Infinity

    • 如果單一資料集同時具有 InfinityDouble.MAX_VALUE,且百分位數結果為 Double.MAX_VALUE,Athena 便會傳回 Infinity

    • 若要從計算中排除 InfinityNaN,請使用 is_finite() 函數,如下列範例所示。

      approx_percentile(x, 0.5) FILTER (WHERE is_finite(x))

2023 年 3 月 27 日

2023-03-27 發布

您現在可以為 Amazon Athena 的 Athena SQL 工作群組指定最低加密層級。此功能可確保 Athena SQL 工作群組中所有查詢的結果在您指定的加密層級或以上加密。您可以選擇多種層級的加密強度來保護您的資料。若要設定所需的最低加密層級,您可以使用 Athena 主控台 AWS CLI、API 或 SDK。

最低加密功能不適用於已啟用 Apache Spark 的工作群組。如需詳細資訊,請參閱 為工作群組設定最低加密

2023 年 3 月 17 日

2023-03-17 發布

Athena 發布下列修復和改善。

  • 修正 Amazon Athena DynamoDB 連接器造成查詢失敗且錯誤訊息KeyConditionExpressions 每個金鑰只能包含一個條件的問題。

    此問題是因為 Athena 引擎版本 3 能夠比 Athena 引擎版本 2 下推更多類型的述詞。在 Athena 引擎版本 3 中,類似 some_column LIKE 'someprefix% 的子句會被下推為在指定資料欄上套用下限和上限的篩選條件述詞。Athena 引擎版本 2 沒有下推這些述詞。在 Athena 引擎版本 3 中,如果 some_column 是排序索引鍵資料欄,引擎會將篩選條件述詞下推至 DynamoDB 連接器。接著,篩選條件述詞會進一步下推至 DynamoDB 服務。由於 DynamoDB 在排序索引鍵上不支援多個篩選條件,因此 DynamoDB 會傳回錯誤。

    若要修正此問題,請將您的 Amazon Athena DynamoDB 連接器更新至 2023.11.1 版。如需有關更新連接器的說明,請參閱 更新資料來源連接器

2023 年 3 月 8 日

2023-03-08 發布

Athena 發布下列修復和改善。

  • 修正聯合查詢的問題,該問題會造成時間戳記述詞值以微秒而非毫秒傳送。

2023 年 2 月 15 日

2023-02-15 發布

Athena 發布下列修復和改善。

  • 您現在可以使用用戶端加密來加密 Amazon S3 中的資料,以進行 Iceberg 寫入操作。

  • 修正會影響 Amazon S3 中 Iceberg 寫入操作的伺服器端加密的問題。

2023 年 1 月 31 日

2023 年 1 月 31 日發布

您現在可使用 Amazon Athena 在 Google Cloud Storage 中查詢資料。與 Amazon S3 一樣,Google Cloud Storage 是一項受管服務,可將資料存放在儲存貯體中。使用適用於 Google Cloud Storage 的 Athena 連接器,對外部資料執行互動式聯合查詢。

如需詳細資訊,請參閱 Amazon Athena Google Cloud Storage 連接器

2023 年 1 月 20 日

2023 年 1 月 20 日發布

您現在可以查看 Athena 壓縮支援的擴充文件。已針對 Hive 資料表壓縮Iceberg 資料表壓縮ZSTD 壓縮級別 新增單獨主題。

如需詳細資訊,請參閱 Athena 壓縮支援

2023 年 1 月 3 日

2023-01-03 發布

Athena 發布下列更新:

  • Hive 中繼存放區的其他命令 – 您可以使用 Athena 連線到自我管理的 Apache Hive 中繼存放區作為中繼資料目錄,並查詢存放在 Amazon S3 中的資料。在此版本中,您可以使用 CREATE TABLE AS (CTAS)、INSERT INTO 和 12 個其他資料定義語言 (DDL) 命令,以與 Apache Hive 中繼存放區進行互動。您可以使用這組擴充的 SQL 功能,直接從 Athena 管理 Hive 中繼存放區結構描述。

    如需詳細資訊,請參閱 將 Athena 資料連接器用於外部 Hive 中繼存放區

  • JDBC 驅動程式 2.0.35 版 – Athena 發布 JDBC 驅動程式 2.0.35 版 JDBC 2.0.35 驅動程式包含下列更新:

    • 該驅動程式現在為 Jackson JSON 剖析器使用以下程式庫。

      • jackson-annotations 2.14.0 (先前為 2.13.2)

      • jackson-core 2.14.0 (先前為 2.13.2)

      • jackson-databind 2.14.0 (先前為 2.13.2.2)

    • 對 JDBC 4.1 版的 Support 已經停止。

    如需詳細資訊並且要下載新的驅動程式、版本備註和文件,請參閱 使用 JDBC 連接到 Amazon Athena

2022 年 Athena 版本備註

2022 年 12 月 14 日

2022-12-14 發布

您現在可以使用適用於 Kafka 的 Amazon Athena 連接器,對串流資料執行 SQL 查詢。例如,您可以在 Amazon Managed Streaming for Apache Kafka (Amazon MSK) 中對即時串流資料執行分析查詢,並將其與 Amazon S3 資料湖中的歷史資料聯結在一起。

適用於 Kafka 的 Amazon Athena 連接器支援多個串流引擎的查詢。您可以使用 Athena 在 Amazon MSK 佈建的無伺服器叢集、自我管理的 Kafka 部署,以及在 Confluent 雲端中的串流資料上執行 SQL 查詢。

如需詳細資訊,請參閱 Amazon Athena MSK 連接器

2022 年 12 月 2 日

2022-12-02 發布

Athena 發佈 JDBC 驅動程式 2.0.34 版。JDBC 2.0.34 驅動程式包括下列新功能和已解決的問題:

  • 查詢結果重複使用支援 – 您現在可以在指定的時間限制內重複使用先前執行的查詢的結果,而不是讓 Athena 在每次執行查詢時重新計算結果。如需詳細資訊,請參閱 JDBC 下載頁面中的安裝和設定指南和 重複使用查詢結果

  • EC2 InstanceMetadata 支援 — JDBC 驅動程式現在支援使用 IAM 執行個體設定檔EC2 InstanceMetadata 身份驗證方法

  • 基於字元的里外狀況修正 – 修正了查詢包含某些語言字元時發生的例外狀況。

  • 弱點修正 — 已更正與連接器一起封裝的相 AWS 依性相關的弱點。

如需詳細資訊並下載新的驅動程式、版本備註和文件,請參閱使用 JDBC 連接到 Amazon Athena

2022 年 11 月 30 日

2022-11-30 發布

您現在可以在 Athena 上以互動方式建立和執行 Apache Spark 應用程式和與 Jupyter 相容的筆記本。使用 Spark 在 Athena 上執行資料分析,而不必規劃、設定或管理資源。提交 Spark 程式碼進行處理並直接接收結果。在 Amazon Athena 主控台中使用筆記本的簡化體驗,以使用 Python 或 Athena 筆記本 API 開發 Apache Spark 應用程式。

Amazon Athena 上的 Apache Spark 是無伺服器,並提供自動的隨需擴展,可提供即時啟動運算,以滿足不斷變化的資料量和處理需求。

如需詳細資訊,請參閱 在 Amazon Athena 使用 Apache Spark

2022 年 11 月 18 日

2022-11-18 發布

您現在可以使用適用於 IBM Db2 的 Amazon Athena 連接器,查詢來自 Athena 的 Db2。例如,您可以在 Db2 上的資料倉儲和 Amazon S3 中的資料湖上執行分析查詢。

Amazon Athena Db2 連接器透過 Lambda 環境變數公開數個組態選項。如需有關組態選項、參數、連接字串、部署和限制的詳細資訊,請參閱 Amazon Athena IBM Db2 連接器

2022 年 11 月 17 日

2022-11-17 發布

Athena 引擎版本 3 中的 Apache Iceberg 支援現提供下列增強型 ACID 交易功能:

  • ORC 和 Avro 支援 – 使用 Apache AvroApache ORC 以資料列和資料欄為基礎的檔案格式,建立 Iceberg 資料表。對這些格式的支援即為對 Parquet 現有支援的補充。

  • 合併為 – 使用 MERGE INTO 命令有效率地大規模合併資料。MERGE INTOINSERTUPDATEDELETE 運算合併為一個交易。這樣可以減少資料管道中的處理負擔,並減少寫入的 SQL。如需詳細資訊,請參閱 更新 Iceberg 資料表資料合併為

  • CTAS 和 VIEW 支援 – 搭配使用 CREATE TABLE AS SELECT (CTAS) 和 CREATE VIEW 陳述式與 Iceberg 資料表。如需詳細資訊,請參閱 CREATE TABLE ASCREATE VIEW

  • VACUUM 支援 – 您可以使用 VACUUM 陳述式刪除不再需要的快照和資料,進而最佳化資料湖。您可以使用此功能來改善讀取效能並符合 GDPR 等法規要求。如需詳細資訊,請參閱 最佳化處理 Iceberg 資料表VACUUM

這些新功能需要 Athena 引擎版本 3,並且適用於支援 Athena 的所有區域。您可以搭配 Athena 主控台驅動程式API 使用它們。

如需有關在 Athena 中使用 Iceberg 的詳細資訊,請參閱 使用 Apache Iceberg 資料表

2022 年 11 月 14 日

2022-11-14 發布

Amazon Athena 現在支援用於傳入連線的 IPv6 端點,而您可以使用這些端點透過 IPv6 叫用 Athena 函數。您可以使用此功能來滿足 IPv6 合規要求。它也不需要額外的聯網設備來處理 IPv4 和 IPv6 之間的位址轉譯。

若要使用此功能,請將應用程式設定為使用支援 IPv4 和 IPv6 的全新 Athena 雙堆疊端點。雙堆疊端點使用該格式 athena.region.api.aws。例如,美國東部 (維吉尼亞北部) 區域的雙堆疊端點是 athena.us-east-1.api.aws

當您請求雙堆疊 Athena 端點時,端點會解析為 IPv6 或 IPv4 地址,具體視您的網路和用戶端使用的通訊協定而異。若要以程式設計方式連線至 AWS 服務,您可以使用AWS CLIAWS SDK 來指定端點。

如需有關服務端點的詳細資訊,請參閱 AWS 服務端點。若要進一步了解 Athena 的服務端點,請參閱 AWS 文件中的 Amazon Athena 端點和配額

您可以使用新的 Athena 雙堆疊端點進行傳入連線,且無需額外付費。雙堆疊端點通常可用於所有 AWS 區域。

2022 年 11 月 11 日

2022-11-11 發布

Athena 發布下列修復和改善。

  • 擴充的 Lake Formation 精細存取控制 – 您現在可以在 Athena 查詢中對以任何支援檔案或資料表格式儲存的資料使用 AWS Lake Formation 精細存取控制政策。您可以在 Lake Formation 中使用精細存取控制,使用資料篩選條件來限制對查詢結果中資料的存取,從而達到資料欄層級、資料列層級和儲存格層級安全性。在 Athena 中支援的資料表格式包括 Apache Iceberg、Apache Hudi 和 Apache Hive。Athena 支援的所有區域均提供擴充的精細存取控制功能。擴充的資料表和檔案格式支援需要 Athena 引擎版本 3,這可提供新功能和改進的查詢效能,但不會變更您在 Lake Formation 中設定精細存取控制政策的方式。

    在 Athena 中使用此擴充的精細存取控制有下列考量:

    如需有關在 Lake Formation 中使用精細定義存取控制的詳細資訊,請參閱 AWS 大數據部落格中的使用 AWS Lake Formation管理精細定義存取控制

  • Athena 聯合查詢 – Athena 聯合查詢現在會保留 struct 物件中欄位名稱的原始大小寫。先前,struct 欄位名稱會自動變成小寫。

2022 年 11 月 8 日

2022-11-08 發布

您現在可以使用查詢結果重複使用快取功能,進而加速 Athena 中的重複查詢。重複查詢是與最近提交的 SQL 查詢相同的查詢,會產生相同的結果。當您需要執行相同的多個查詢時,結果重複使用快取可以減少產生結果所需的時間。結果重複使用快取也會減少掃描的位元組數,進而降低成本。

如需詳細資訊,請參閱 重複使用查詢結果

2022 年 10 月 13 日

2022 年 10 月 13 日發布

Athena 宣布推出 Athena 引擎版本 3。

Athena 已升級其 SQL 查詢引擎,以納入 Trino 開放原始碼專案的最新功能。Athena 引擎版本 3 不僅支援 Athena 引擎版本 2 的所有功能,還包含 50 多個新 SQL 函數、30 項新功能,以及 90 多項查詢效能改進。今天推出的版本中,Athena 也仍然採用持續整合方法,管理開放原始碼軟體,確保 Trino 和 Presto 專案與時俱進,讓您可以更快速地使用到各種改善後的社群功能,並在 Athena 引擎中執行整合和調整。

如需詳細資訊,請參閱 Athena 引擎版本 3

2022 年 10 月 10 日

2022 年 10 月 10 日發布

Athena 發佈 JDBC 驅動程式 2.0.33 版。JDBC 2.0.33 驅動程式有以下變更:

  • 新的驅動程式版本、JDBC 版本和外掛程式名稱屬性已新增至憑證供應商類別中的 user-agent 字串。

  • 錯誤訊息已更正且新增了必要的資訊。

  • 現在,如果連線關閉或 Athena 的預備陳述式執行失敗,則系統會取消配置預備陳述式。

如需詳細資訊並下載新的驅動程式、版本備註和文件,請參閱使用 JDBC 連接到 Amazon Athena

2022 年 9 月 23 日

2022 年 9 月 26 日發布

Amazon Athena Neptune 連接器現在支援不區分大小寫的資料欄和資料表名稱比對。

  • Neptune 資料來源連接器可以解析 Neptune 資料表上使用大小寫的資料欄名稱,即使 AWS Glue中資料表的資料欄名稱都是小寫也一樣。若要啟用此行為,請在 Neptune 連接器 Lambda 函數上將 enable_caseinsensitivematch 環境變數設定為 true

  • 由於僅 AWS Glue 支援小寫資料表名稱,因此當您為 Neptune 建立資 AWS Glue 料表時,請指定 AWS Glue table 參數"glabel" = table_name

如需有關 Neptune 連接器的詳細資訊,請參閱 Amazon Athena Neptune 連接器

2022 年 9 月 13 日

2022 年 9 月 13 日發布

Athena 發布下列修復和改善。

  • 外部 Hive 中繼存放區 - 當 WHERE 子句包含外部 Hive 中繼存放區 (EHMS) 中不存在的分割區時,Athena 現在會傳回 NULL 而不是擲回例外狀況。新行為符合 AWS Glue Data Catalog的行為。

  • 參數化查詢 - 參數化查詢中的值現在可轉換為 DOUBLE 資料類型。

  • Apache Iceberg - 在 Amazon S3 儲存貯體中啟用 Object Lock (物件鎖定) 時,對 Iceberg 資料表的寫入操作現在會成功。

2022 年 8 月 31 日

2022 年 8 月 31 日發布

Amazon Athena 宣佈 Athena 及其功能可在亞太區域 (雅加達) 使用。

此版本擴展了 Athena 在亞太區域的可用性,以包含亞太區域 (香港)、亞太區域 (雅加達)、亞太區域 (孟買)、亞太區域 (大阪)、亞太區域 (首爾)、亞太區域 (新加坡)、亞太區域 (新加坡)、亞太區域 (雪梨) 和亞太區域 (東京)。如需在這些和其他區域中的可用 AWS 服務 完整清單,請參閱 AWS 區域區域服務清單

2022 年 8 月 23 日

2022-08-23 發布

Athena Query Federation 軟體開發套件 2022.32.1 版包含下列變更:

  • Amazon Athena Oracle 資料來源連接器新增以 SSL 連線 Amazon RDS 執行個體的相關支援。支援範圍僅限於 Transport Layer Security (TLS) 通訊協定,以及用戶端對伺服器執行的身分驗證作業。由於 Amazon RDS 不支援交互身分驗證,因此該更新不包含對交互身分驗證的支援。

    如需詳細資訊,請參閱 Amazon Athena Oracle 連接器

2022 年 8 月 3 日

2022-08-03 發布

Athena 發佈 JDBC 驅動程式 2.0.32 版。JDBC 2.0.32 驅動程式包括以下變更:

  • 傳送至 Athena 軟體開發套件的 User-Agent 字串已有所擴充,內含驅動程式版本、JDBC 規格版本,以及身分驗證外掛程式的名稱。

  • 修正未提供任何 CheckNonProxyHost 參數值時,系統擲回的 NullPointerException

  • 修正 BrowserSaml驗證外掛程式中login_url剖析的問題。

  • 修正 UseProxyforIdp 參數設為 true 時所發生的代理主機問題。

如需詳細資訊並下載新的驅動程式、版本備註和文件,請參閱使用 JDBC 連接到 Amazon Athena

2022 年 8 月 1 日

2022-08-01 發布

Athena 宣布針對 Athena Query Federation 軟體開發套件和 Athena 預先建置資料來源連接器的改善 改善項目包括:

  • 結構剖析 – 修正了 Athena Query Federation 軟體開發套件中的 GlueFieldLexer 剖析問題,會導致某些複雜的結構無法顯示其所有資料。此問題會影響在 Athena Query Federation 軟體開發套件上建置的連接器。

  • AWS Glue 表格 — 已新增對 AWS Glue 表格中setdecimal欄類型的其他支援。

  • DynamoDB 連接器 – 新增了忽略 DynamoDB 屬性名稱上大小寫的功能。如需詳細資訊,請參閱 Amazon Athena DynamoDB 連接器 頁面之 參數 區段的 disable_projection_and_casing

如需詳細資訊,請參閱《Athena 查詢聯盟》v2022.30.2 版。 GitHub

2022 年 7 月 21 日

2022-07-21 發布

您現在可以在 Athena 主控台中使用效能指標和互動式視覺化查詢分析工具來對您的查詢進行分析和除錯。查詢效能資料和執行詳細資訊可協助您找出查詢中的瓶頸、檢查每個查詢階段的運算子和統計資料、追蹤階段之間流動的資料量,以及驗證查詢述詞的影響。您現在可以:

  • 只要按一下,即可存取您查詢的分散式和邏輯執行計劃。

  • 在階段執行之前,探索每個階段的操作。

  • 使用在佇列、規劃和執行階段所花費時間的指標,將已完成查詢的效能視覺化。

  • 針對您的查詢所處理和輸出的資料列數和來源資料數量,取得相關資訊。

  • 查看以情境呈現並採用互動式圖形格式的查詢的精細執行詳細資訊。

  • 使用精確的階段層級執行詳細資訊,來了解查詢過程中的資料流。

  • 使用亦於今日發布的新的 API,以程式設計方式分析查詢效能資料,以《取得查詢執行期資料》。

若要了解如何在查詢中使用這些功能,請觀看影片教學課程在頻 AWS YouTube 道上使用新的查詢分析工具優化 Amazon Athena 查詢。

如需說明文件,請參閱 檢視 SQL 查詢的執行計劃檢視已完成查詢的統計資料和執行詳細資訊

2022 年 7 月 11 日

2022-07-11 發布

您現在可以直接從 Athena 主控台或 API 執行參數化查詢,而不需要事先準備 SQL 陳述式。

當您在 Athena 主控台中執行具有問號形式參數的查詢時,使用者介面現在會提示您直接輸入參數值。如此一來,每次您想要執行查詢時,就不需要在查詢編輯器中修改字面值。

如果您使用增強的《查詢執行》API,您現在可以在單一呼叫中提供執行參數及其值。

如需詳細資訊,請參閱本使用者指南中的 使用參數化查詢 以及 AWS 大數據部落格文章Use Amazon Athena parameterized queries to provide data as a service (使用 Amazon Athena 參數化查詢提供資料即服務)。

2022 年 7 月 8 日

2022-07-08 發布

Athena 發布下列修復和改善。

  • 修正導致查詢失敗之 SageMaker端點 (UDF) 的DATE資料行轉換處理問題。

2022 年 6 月 6 日

2022-06-06 發布

Athena 發佈了 JDBC 驅動程式 2.0.31 版。JDBC 2.0.31 驅動程式包括以下變更:

  • log4j 相依性問題 – 已解決因 log4j 相依性所引起的找不到驅動程式類別錯誤訊息。

如需詳細資訊並下載新的驅動程式、版本備註和文件,請參閱使用 JDBC 連接到 Amazon Athena

2022 年 5 月 25 日

2022 年 5 月 25 日發布

Athena 發布下列修復和改善。

  • Iceberg 支援

    • 推出跨區域查詢支援。現在,您可以查詢與您正在使用的不同的 AWS 區域 冰山表。 AWS 區域

    • 推出對伺服器端加密組態的支援。現在,您可以使用 SSE-S3/SSE-KMS,來加密 Amazon S3 中的 Iceberg 寫入操作。

    如需有關在 Athena 中使用 Apache Iceberg 的詳細資訊,請參閱使用 Apache Iceberg 資料表

  • JDBC 2.0.30 驅動程式發布

    Athena 的 JDBC 2.0.30 Athena 驅動程式進行了以下改進:

    • 修復了影響參數化準備陳述式的資料爭用問題。

    • 修復了 Gradle 建置環境中發生的應用程式啟動問題。

    若要下載 JDBC 2.0.30 驅動程式、版本備註和文件,請參閱使用 JDBC 連接到 Amazon Athena

2022 年 5 月 6 日

2022-05-06 發布

推出了 Athena JDBC 2.0.29 和 ODBC 1.1.17 驅動程式。

這些驅動程式包括下列變更:

  • 更新了 SAML 外掛程式瀏覽器啟動程序。

如需有關這些變更以及下載新驅動程式、版本備註和文件的詳細資訊,請參閱使用 JDBC 連接到 Amazon Athena使用 ODBC 連接到 Amazon Athena

2022 年 4 月 22 日

2022-04-22 發布

Athena 發布下列修復和改善。

  • 修正分割區索引和篩選功能中的問題,其中滿足以下條件時會發生分割快取:

    • 在資料表的 AWS Glue 資料表屬性true中,partition_filtering.enabled索引鍵已設定為。

    • 可以採用不同的分割區篩選條件值多次使用相同的資料表。

2022 年 4 月 21 日

2022-04-21 發布

您現在可以使用 Amazon Athena 在新的數據源上運行聯合查詢,包括谷歌 BigQuery,Azure 突觸和雪花。新的資料來源連接器包括:

如需 Athena 支援的資料來源完整清單,請參閱可用資料來源連接器

為了更輕鬆地瀏覽可用來源並連接到資料,您現在可以從 Athena 主控台中更新的 Data Sources (資料來源) 螢幕搜尋、排序及篩選可用的連接器。

若要瞭解有關查詢聯合來源的資訊,請參閱 使用 Amazon Athena 聯合查詢執行聯合查詢

2022 年 4 月 13 日

2022-04-13 發布

Athena 發佈了 JDBC 驅動程式 2.0.28 版。JDBC 2.0.28 驅動程式包括以下變更:

  • JWT 支援 – 驅動程式現已支援 JSON Web 字符 (JWT) 進行身分驗證。如需搭配使用 JWT 與 JDBC 驅動程式的資訊,請參閱安裝和設定指南,可從 JDBC 驅動程式頁面下載該指南。

  • 更新 Log4j 程式庫 – JDBC 驅動程式現使用以下 Log4j 程式庫:

    • Log4j-api 2.17.1 (先前為 2.17.0)

    • Log4j-core 2.17.1 (先前為 2.17.0)

    • Log4j-jcl 2.17.2

  • 其他改進 – 新驅動程式還包含以下改進和錯誤修正:

    • Athena 預備陳述式功能現可透過 JDBC 使用。如需預備陳述式的資訊,請參閱使用參數化查詢

    • Athena JDBC SAML 聯合現可在中國地區正常運作。

    • 其他次要改進。

如需詳細資訊並下載新的驅動程式、版本備註和文件,請參閱使用 JDBC 連接到 Amazon Athena

2022 年 3 月 30 日

2022-03-30 發布

Athena 發布下列修復和改善。

  • 跨區域查詢 — 您現在可以使用 Athena 查詢位於 Amazon S3 儲存貯體中的資料, AWS 區域 包括亞太區域 (香港)、中東 (巴林)、非洲 (開普敦) 和歐洲 (米蘭)。

2022 年 3 月 18 日

2022-03-18 發布

Athena 發布下列修復和改善。

  • 動態篩選 – 透過有效地將篩選條件套用於相應資料的每條記錄,改善了整數欄的動態篩選

  • Iceberg – 修復寫入大於 2GB 的 Iceberg Parquet 檔案時導致故障的問題。

  • 未壓縮輸出CREATE TABLE陳述式現在支援編寫未壓縮的檔案。若要編寫未壓縮檔案,請使用下列語法:

    • CREATE TABLE (文字檔案或 JSON) – 在 TBLPROPERTIES 中,指定 write.compression = NONE

    • CREATE TABLE (Parquet) – 在 TBLPROPERTIES 中,指定 parquet.compression = UNCOMPRESSED

    • CREATE TABLE (ORC) – 在 TBLPROPERTIES 中,指定 orc.compress = NONE

  • 壓縮 – 修復了使用非預設壓縮方法時以一種格式建立壓縮檔案,但使用另一種壓縮格式檔案副檔名的文字檔案資料表插入問題。

  • Avro – 修復了從 Avro 檔案讀取固定類型的小數時發生的問題。

2022 年 3 月 2 日

2022-03-02 發布

Athena 發布了下列功能以及強化功能。

  • 針對查詢結果儲存貯體,當 ACL 已啟用時,您現在可以授予 Simple Storage Service (Amazon S3) 儲存貯體擁有者對查詢結果的完整控制存取。如需詳細資訊,請參閱 指定查詢結果位置

  • 您現在可以更新現有已命名的查詢。如需詳細資訊,請參閱 使用已儲存的查詢

2022 年 2 月 23 日

2022-02-23 發布

Athena 發布下列修復和效能改善。

  • 記憶體處理改善,以強化效能並減少記憶體錯誤。

  • Athena 現在讀取 ORC 時間戳記欄以及存放在 Stripe 註腳中的時區資訊,並連同註腳中的時區 (UTC) 寫入 ORC 檔案。如果要讀取的 ORC 檔案是在非 UTC 時區環境中建立的,則這只會影響 ORC 時間戳記讀取的行為。

  • 修復導致次優查詢計畫的錯誤的符號連結資料表大小估算。

  • 現在可以在 Athena 主控台中從 Hive 中繼存放區資料來源查詢橫向展開檢視。

  • 改善 Simple Storage Service (Amazon S3) 讀取錯誤訊息,以包含更詳細的 Simple Storage Service (Amazon S3) 錯誤代碼資訊。

  • 修復導致 ORC 格式輸出檔案與 Apache Hive 3.1 不相容的問題。

  • 修復導致在某些 DML 和 DDL 查詢中具有引號的資料名稱失敗的問題。

2022 年 2 月 15 日

2022-02-15 發布

Amazon Athena 已增加所有 AWS 區域的使用中 DML 查詢配額。作用中查詢包括執行中和佇列中的查詢。借由本次變更,您現在可以擁有比以前更多的作用中狀態的 DML 查詢。

如需 Athena 服務配額的相關資訊,請參閱Service Quotas。有關使用 Athena 的區域中的查詢配額,請參閱 AWS 一般參考 中的 Amazon Athena 端點和配額

若要監控配額使用量,您可以使用使 CloudWatch 用量度。Athena 在 AWS/Usage 命名空間中發布 ActiveQueryCount 指標。如需詳細資訊,請參閱 監控 Athena 用量指標

查看您的用量後,您可以使用 Service Quotas 主控台請求提高配額。如果您之前已請求提高帳戶的配額,則如果您請求的配額超過新的預設作用中 DML 查詢配額,則請求的配額仍適用。否則,所有帳戶都會使用新的預設值。

2022 年 2 月 14 日

2022-02-14 發布

此版本將ErrorType分欄新增至 Athena GetQueryExecutionAPI 動作中的AthenaError回應物件。

雖然現有的 ErrorCategory 欄位顯示失敗查詢的一般來源 (系統、使用者或其他),但新的 ErrorType 欄位會提供發生的錯誤的更詳細資訊。結合這兩個欄位中的資訊,以取得查詢失敗原因的洞察。

如需詳細資訊,請參閱 Athena 錯誤目錄

2022 年 2 月 9 日

2022-02-09 發布

舊版 Athena 主控台無法再使用。Athena 的新版主控台可支援舊版主控台的所有功能,但具有更好用的新型介面,內含的新功能可改進查詢開發、分析資料和管理使用情況等體驗。若要使用新版的 Athena 主控台,請造訪 https://console.aws.amazon.com/athena/

2022 年 2 月 8 日

2022-02-08 發布

預期值區擁有者 — 作為一項額外的安全性措施,您現在可以選擇性地指定您希望成為 Athena 中查詢結果輸出位置值區擁有者的 AWS 帳戶 ID。如果查詢結果儲存貯體擁有者的帳戶 ID 與您在此處指定的 ID 不符,則嘗試輸出到儲存貯體的動作會失敗並產生 Simple Storage Service (Amazon S3) 許可錯誤。您可在客戶端或工作群組層級進行此設定。

如需詳細資訊,請參閱 指定查詢結果位置

2022 年 1 月 28 日

2022-01-28 發布

Athena 推出下列引擎強化功能。

  • Apache Hudi – 在 Hudi 讀取時合併 (MOR) 資料表上的快照查詢現在可以讀取有 INT64 資料類型的時間戳記資料欄。

  • UNION 查詢 – 效能改進並減少某些 UNION 查詢 (會掃描同一個資料表多次) 的掃描次數。

  • 分區查詢 – 篩選條件只使用各分割區資料欄的分區值時提高查詢效能。

  • 分割區投影強化功能

    • 現在篩選條件已可使用分區值來查詢 injected 類型的資料欄。如需詳細資訊,請參閱 注入類型

    • 篩選條件只使用諸如 CHARVARCHAR 等字串型資料欄分區值來進行查詢的效能已經改進。

2022 年 1 月 13 日

2022-01-13 發布

推出了 Athena JDBC 2.0.27 和 ODBC 1.1.15 驅動程式。

JDBC 2.0.27 驅動程式包括以下變更:

  • 驅動程式已更新,可檢索外部目錄。

  • 延伸的驅動程式版本號現已包含在 Athena API 呼叫的 user-agent 字串中。

ODBC 1.1.15 驅動程式包括以下變更:

  • 透過第二次呼叫 SQLParamData() 來修正問題。

如需有關這些變更以及下載新驅動程式、版本備註和文件的詳細資訊,請參閱使用 JDBC 連接到 Amazon Athena使用 ODBC 連接到 Amazon Athena

2021 年 Athena 版本備註

2021 年 11 月 26 日

2021-11-26 發布

Athena 推出的 Athena ACID 交易公開預覽版,可在 Athena 的 SQL 資料處理語言 (DML) 中新增寫入、刪除、更新和時間歷程查詢等操作。Athena ACID 交易可讓多名使用者同時對 Simple Storage Service (Amazon S3) 資料進行可靠的資料列級修改。以 Apache Iceberg 資料表格式建立的 Athena ACID 交易與 Amazon EMRApache Spark 等其他也支援 Iceberg 資料表格式的服務相容。

Athena ACID 交易和熟悉的 SQL 語法可簡化您的業務和法規資料的更新。例如,若要回應資料清除請求,您可以執行 SQL DELETE 操作。若要進行手動記錄更正,您可以使用單一 UPDATE 陳述式。若要復原最近刪除的資料,您可以使用 SELECT 陳述式發布時間歷程查詢。Athena 交易可透過 Athena 主控台、API 操作以及 ODBC 和 JDBC 驅動程式取得。

如需詳細資訊,請參閱 使用 Athena ACID 交易

2021 年 11 月 24 日

2021-11-24 發布

Athena 宣佈支援讀取和寫入 ZStandard 壓縮 ORC、Parquet 和文字檔案資料。寫入 ZStandard 壓縮資料時,Athena 會使用 ZStandard 壓縮第 3 級。

如需有關 Athena 中資料壓縮的資訊,請參閱Athena 壓縮支援

2021 年 11 月 22 日

2021-11-22 發布

您現在可以從 Amazon Athena 主控台管理 AWS Step Functions 工作流程,輕鬆建置可擴展的資料處理管道、根據自訂商業邏輯執行查詢、自動化管理和警示任務等等。

Step Functions 現已與 Athena 的升級主控台整合在一起,您可以使用它來查看調用 Athena 的狀態機器的互動式工作流程圖。若要開始使用,請在左邊的導覽窗格中選擇工作流程。如果現有的狀態機器具有 Athena 查詢功能,請選擇該狀態機器以查看互動式工作流程圖。如果您是 Step Functions 的新手,一開始可使用 Athena 主控台啟動範例專案並自訂該專案,使其配合您的使用案例的需求。

如需詳細資訊,請參閱使用 Amazon Athena 建置和協調 ETL 管道 AWS Step Functions,或參閱 Step Functions 文件。

2021 年 11 月 18 日

2021-11-18 發布

Athena 發布了新版功能和強化功能。

  • Support 包含DISTINCTORDER BY或兩者的彙總查詢,如下列範例所示: spill-to-disk

    SELECT array_agg(orderstatus ORDER BY orderstatus) FROM orders GROUP BY orderpriority, custkey
  • 解決了使用 DISTINCT 的查詢的記憶體處理問題。為了避免在使用 DISTINCT 查詢時出現這個規模的查詢用盡了資源等錯誤訊息,請選擇低基數的 DISTINCT,或是減少查詢的資料大小。

  • 不指定特定資料欄的 SELECT COUNT(*) 查詢透過僅保留計數而不使用資料列緩衝提高了效能並改進記憶體使用率。

  • 採用了下列字串函數。

    • translate(source, from, to) – 傳回 source 字串,其中包含在 from 字串中的字元會替換成 to 字串中的對應字元。如果 from 字串包含重複項目,則只使用第一個項目。如果 from 字串中沒有 source 字元,則會複製 source 字元而不轉譯。如果檢索出 from 字串中的字元大於 to 字串的長度,則最後產生的字串會省略該字元。

    • concat_ws(string0, array(varchar)) – 傳回串連的數列,使用 string0 作為分隔符號。如果 string0 為 NULL,則傳回值為 NULL。會略過數列中的任何 NULL 值。

  • 修復了因嘗試存取 struct 中缺少的子欄位而發生查詢失敗的錯誤。查詢現在會在缺少子欄位時傳回 NULL 值。

  • 修復了小數資料類型雜湊不一致的問題。

  • 修復了分割區中資料欄過多而導致資源用盡的問題。

2021 年 11 月 17 日

2021-11-17 發布

Amazon Athena 現在支援分割區檢索以加速 AWS Glue Data Catalog 中已分割的資料表的查詢。

查詢已分割的資料表時,Athena 會檢索可用的資料表分割區,並篩選出與您的查詢相關的一小部分資料。隨著新資料和分割區的增加,處理分割區需要更長的時間,執行查詢的時間可能會增加。為了最佳化分割區的處理並提高對高度已分割的資料表的查詢效能,Athena 現已支援 AWS Glue 分割區檢索

如需詳細資訊,請參閱 AWS Glue 分割區索引和篩選

2021 年 11 月 16 日

2021-11-16 發布

全新且改良的 Amazon Athena 主控台現已在提供 A thena 服務的 AWS 商業和 GovCloud 地區正式推出。Athena 的新版主控台可支援舊版主控台的所有功能,但具有更好用的新型介面,內含的新功能可改進查詢開發、分析資料和管理使用情況等體驗。您現在可以:

  • 使用新版的分頁列來重新排列、導覽或關閉多個查詢索引標籤。

  • 透過改進後的 SQL 和文字設定格式,更輕鬆地讀取和編輯查詢。

  • 除了下載完整的結果集之外,還可將查詢結果複製到剪貼簿。

  • 將查詢的歷史記錄、已儲存的查詢和工作群組加以排序,然後選擇要顯示或隱藏的資料欄。

  • 使用簡化的界面,設定資料來源和工作群組所需的點選次數更少。

  • 設定用於顯示查詢結果、查詢歷史記錄、換行等功能的偏好設定。

  • 利用新的改良版鍵盤快速鍵和嵌入式產品文件提高您的工作效率。

隨著今天的宣佈,新版主控台現已成為預設設定。若要跟我們分享您的使用體驗,請選擇主控台左下角的意見回饋

如有需要,您可以登入您的主控台 AWS 帳戶,選擇 Amazon Athena,然後從左側導覽面板取消選取新 Athena 體驗,以使用舊版主控台。

2021 年 11 月 12 日

2021-11-12 發布

您現已可用 Amazon Athena 對位於 AWS 帳戶 (非您自己所有) 的資料來源執行聯合查詢。直到今天,查詢此資料時,資料來源及其連接器必須使用與查詢資料的使用者相同 AWS 帳戶 的連接器。

若您是資料管理員,可透過與資料分析師的帳戶共用資料連接器來啟用跨帳戶的聯合查詢。若您是資料分析師,可將資料管理員與您共用的資料連接器加到您的帳戶中。對原始帳戶中連接器的組態變更會自動套用於共用連接器。

如需有關啟用跨帳戶聯合查詢的資訊,請參閱啟用跨帳戶聯合查詢。若要瞭解有關查詢聯合來源的資訊,請參閱 使用 Amazon Athena 聯合查詢執行聯合查詢

2021 年 11 月 2 日

2021-11-02 發布

現在已可使用 Athena 中的 EXPLAIN ANALYZE 陳述式來查看 SQL 查詢的分散式執行計劃,以及每項操作的成本。

如需詳細資訊,請參閱 在 Athena 使用 EXPLAIN 和 EXPLAIN ANALYZE

2021 年 10 月 29 日

2021-10-29 發布

Athena 發佈了 JDBC 2.0.25 和 ODBC 1.1.13 驅動程式,並宣佈改良過後的功能。

JDBC 和 ODBC 驅動程式

發布了 Athena 的 JDBC 2.0.25 和 ODBC 1.1.13 驅動程式。這兩個驅動程式都支持瀏覽器 SAML 多重要素驗證,可設定此驗證法,使其用於任何 SAML 2.0 提供者。

JDBC 2.0.25 驅動程式包括以下變更:

  • 支援瀏覽器 SAML 身分驗證。此驅動程式所含的瀏覽器 SAML 外掛程式可設定為用於任何 SAML 2.0 提供者。

  • Support AWS Glue API 呼叫。您可使用 GlueEndpointOverride 參數來覆寫 AWS Glue 端點。

  • com.simba.athena.amazonaws 類路徑已改為 com.amazonaws

ODBC 1.1.13 驅動程式包括以下變更:

  • 支援瀏覽器 SAML 身分驗證。此驅動程式所含的瀏覽器 SAML 外掛程式可設定為用於任何 SAML 2.0 提供者。有關如何將瀏覽器 SAML 外掛程式與 ODBC 驅動程式一起使用的範例,請參閱 使用 ODBC、SAML 2.0 和 Okta 身分提供者設定單一登入

  • 現已可在使用 ADFS、Azure AD 或瀏覽器 Azure AD 進行身分驗證時,設定角色工作階段的持續時間。

如需有關這些變更以及其他變更和下載新驅動程式、版本備註和文件的詳細資訊,請參閱使用 JDBC 連接到 Amazon Athena使用 ODBC 連接到 Amazon Athena

功能和改進

Athena 發布了下列功能以及強化功能。

  • 已推出新版最佳化規則,可避免在某些情況下重複掃描資料表。

2021 年 10 月 4 日

2021-10-04 發布

Athena 發布了下列功能以及強化功能。

  • SQL 位移SELECT 陳述式現已支援 SQL OFFSET 子句。如需詳細資訊,請參閱 SELECT

  • CloudWatch 使用量度 — Athena 現在會在AWS/Usage命名空間中發佈ActiveQueryCount量度。如需詳細資訊,請參閱 監控 Athena 用量指標

  • 查詢規劃 – 已修正在極少數情況下可能導致查詢規劃逾時的錯誤。

2021 年 9 月 16 日

2021-09-16 發布

Athena 發布了下列新版功能以及強化功能。

功能

  • 利用 write_compression 資料表屬性提高了對在 CTAS 中指定文字檔案和 JSON 壓縮時的支援。您還可在 CTAS 中指定用於 Parquet 和 ORC 格式的 write_compression 屬性。如需詳細資訊,請參閱 CTAS 資料表屬性

  • 現已支援編寫文字檔案和 JSON 檔案時使用 BZIP2 壓縮格式。如需有關 Athena 中壓縮格式的資訊,請參閱Athena 壓縮支援

改善項目

  • 修復了身分資訊無法發送給 UDF Lambda 函數的錯誤。

  • 修復了帶有分離篩選條件的述詞下推問題。

  • 修復了小數類型的雜湊問題。

  • 修復了不必要的統計數字收集問題。

  • 刪除了不一致的錯誤訊息。

  • 藉由在工作節點中套用動態分割區剪清除來改善廣播聯結效能。

  • 針對聯合查詢:

    • 已更改組態以減少聯合查詢時發生 CONSTRAINT_VIOLATION 錯誤。

2021 年 9 月 15 日

2021-09-15 發布

您現已可使用新版的 Amazon Athena 主控台 (預覽版)。已推出了新版 Athena JDBC 驅動程式。

Athena 主控台預覽版

您現在可以在任何可用 Athena 的 AWS 區域 地方使用重新設計的 Amazon Athena 主控台 (預覽版)。新版主控台支援現有主控台的所有功能,但其新型介面更加好用。

若要切換到新主控台,請登入您的主控台, AWS 帳戶 然後選擇 Amazon Athena。在 AWS 主控台導覽列中,選擇 [切換至新主控台]。若要恢復成預設的主控台,請取消選取左側導覽窗格中的 New Athena experience (新版 Athena 體驗)。

立即開始使用新版主控台。請選擇左下角的意見回饋,跟我們分享您的使用體驗。

Athena JDBC 2.0.24 版驅動程式

Athena 宣佈推出 Athena 的 JDBC 2.0.24 版驅動程式。此版本更新了所有憑據提供者的代理支援。驅動程式現已支援 NonProxyHosts 連接屬性不支援的所有主機的代理身分驗證。

為了方便起見,此版本包括 JDBC 驅動程序的下載,無論是否使用 AWS SDK。此 JDBC 驅動程式版本讓您的專案可同時使用內嵌的 AWS開發套件和 Athena JDBC 驅動程式。

如需詳細資訊並且要下載新的驅動程式、版本備註和文件,請參閱使用 JDBC 連接到 Amazon Athena

2021 年 8 月 31 日

2021-08-31 發布

Athena 宣佈下列功能增強和錯誤修正。

  • Athena 聯合增強功能 – Athena 已經增加對映射類型的支援,以及對複雜類型的更好支援,作為 Athena Query Federation 軟體開發套件的一部分。此版本也包含一些記憶體增強功能和效能最佳化。

  • 新的錯誤類別 – 引入了 USERSYSTEM 錯誤訊息中的錯誤類別。這些類別可協助您區分可自行修正的錯誤 (USER),以及可能需要 Athena 支援協助的錯誤 (SYSTEM)。

  • 聯合查詢錯誤訊息 – 更新了聯合查詢相關錯誤的 USER_ERROR 分類。

  • JOIN — 修正 spill-to-disk 相關錯誤和記憶體問題,以增強效能並減少JOIN作業中的記憶體錯誤。

2021 年 8 月 12 日

2021-08-12 發布

發行了 Athena 的 ODBC 1.1.12 驅動程式。此版本修正了 SQLPrepare()SQLGetInfo() 以及 EndpointOverride 的相關問題。

若要下載新的驅動程式、版本備註和文件,請參閱使用 ODBC 連接到 Amazon Athena

2021 年 8 月 6 日

2021-08-06 發布

Amazon Athena 宣佈 Athena 及其功能可在亞太區域 (大阪) 區域使用。

此版本擴展了 Athena 在亞太區域的可用性,以包含亞太區域 (香港)、亞太區域 (孟買)、亞太區域 (大阪)、亞太區域 (首爾)、亞太區域 (新加坡)、亞太區域 (新加坡)、亞太區域 (雪梨) 和亞太區域 (東京)。如需這些地區和其他區域 AWS 服務 可用的完整清單,請參閱 AWS 區域al 服務清單

2021 年 8 月 5 日

2021-08-05 發布

您可以使用 UNLOAD 陳述式,將 SELECT 查詢的輸出寫入 PARQUET、ORC、AVRO 和 JSON 格式。

如需詳細資訊,請參閱UNLOAD

2021 年 7 月 30 日

2021-07-30 發布

Athena 宣佈下列功能增強和錯誤修正。

  • 動態篩選和分割區剔除 – 改善項目可提高效能並降低某些查詢中的掃描資料量,如下列範例所示。

    此範例假設 Table_B 是未分割的資料表,其檔案大小加起來小於 20 MB。針對這樣的查詢,從 Table_A 讀取的資料更少且查詢完成更快。

    SELECT * FROM Table_A JOIN Table_B ON Table_A.date = Table_B.date WHERE Table_B.column_A = "value"
  • ORDER BY with LIMIT, DISTINCT with LIMIT – 針對後面接著 LIMIT 子句且使用 ORDER BYDISTINCT 的查詢進行效能改善。

  • S3 Glacier Deep Archive 檔案 – 當 Athena 查詢一個混合 S3 Glacier Deep Archive 檔案和非 S3 Glacier 檔案的資料表時,Athena 現在會替您略過 S3 Glacier Deep Archive 檔案。先前,您需手動將這些檔案從查詢位置移動,否則查詢會失敗。如果您想要使用 Athena 查詢 S3 Glacier Deep Archive 儲存空間中的物件,則必須將其還原。如需詳細資訊,請參閱《Simple Storage Service (Amazon S3) 使用者指南》中的還原已封存的物件

  • 修正了 CTAS bucketed_by 資料表屬性建立的空檔案未能正確加密的錯誤。

2021 年 7 月 21 日

2021-07-21 發布

透過 2021 年 7 月發行的 Microsoft Power BI 桌面版,您可以使用 Amazon Athena 的原生資料來源連接器來建立報告和儀表板。Amazon Athena 的連接器可作為 Power BI 中的標準連接器使用 DirectQuery,並可透過 Power BI 閘道對大型資料集進行分析和內容重新整理。

因為連接器使用您現有的 ODBC 資料來源名稱 (DSN) 來連接至 Athena 並在上面執行查詢,所以它需要 Athena ODBC 驅動程式。若要下載最新的 ODBC 驅動程式,請參閱使用 ODBC 連接到 Amazon Athena

如需詳細資訊,請參閱使用 Amazon Athena Power BI 連接器

2021 年 7 月 16 日

2021-07-16 發布

Amazon Athena 已經更新了與 Apache Hudi 的整合。Hudi 是一個開源資料管理架構,用於簡化 Simple Storage Service (Amazon S3) 資料湖中的增量資料處理。更新後的整合讓您能夠使用 Athena 查詢透過 Amazon EMR、Apache Spark、Apache Hive 或其他兼容服務管理的 Hudi 0.8.0 資料表。此外,Athena 現在支援兩項其他功能:讀取時合併 (MoR) 資料表上的快照查詢,以及讀取引導資料表的支援。

Apache Hudi 提供記錄層級的資料處理,可協助您簡化變更資料擷取 (CDC) 管道的開發、符合歐盟《一般資料保護規範》(GDPR) 驅動的更新和刪除,以及更好地管理串流資料,這些資料來自需要資料插入和事件更新的感應器或裝置。0.8.0 版本可以更容易地將大型 Parquet 資料表遷移至 Hudi,而無需複製資料,因此您可以透過 Athena 查詢和分析它們。您可以使用 Athena 適用於快照查詢的新支援,以近乎即時的方式檢視串流資料表更新。

若要進一步了解如何搭配 Athena 使用 Hudi,請參閱使用 Athena 查詢 Apache Hudi 資料集

2021 年 7 月 8 日

2021-07-08 發布

發行了 Athena 的 ODBC 1.1.11 驅動程式。ODBC 驅動程式現在可以使用 JSON Web Token (JWT) 驗證連線。在 Linux 上,Workgroup (工作群組) 屬性的預設值已設定為 Primary (主要)。

如需詳細資訊並且要下載新的驅動程式、版本備註和文件,請參閱使用 ODBC 連接到 Amazon Athena

2021 年 7 月 1 日

2021-07-01 發布

2021 年 7 月 1 日,預覽工作群組的特殊處理已結束。雖然 AmazonAthenaPreviewFunctionality 工作群組會保留其名稱,但是不再具有特殊狀態。您可以繼續使用 AmazonAthenaPreviewFunctionality 工作群組來檢視、修改、組織和執行查詢。不過,使用先前預覽版功能的查詢現在受標準 Athena 帳單條款與條件的約束。如需帳單資訊,請參閱 Amazon Athena 定價

2021 年 6 月 23 日

2021-06-23 發布

發行了 Athena 的 JDBC 2.0.23 和 ODBC 1.1.10 驅動程式。這兩種驅動程式都能提供改善的讀取效能,並支援 EXPLAIN 陳述式和參數化查詢

EXPLAIN 陳述式會顯示 SQL 查詢的邏輯或分散式執行計劃。透過參數化查詢,可以採用執行時提供的不同值多次使用相同的查詢。

JDBC 版本也會新增對 Active Directory Federation Services 2019 的支援,以及適用於 AWS STS的自訂端點覆寫選項。ODBC 版本修正了 IAM 設定檔憑證的問題。

如需詳細資訊並且要下載新的驅動程式、版本備註和文件,請參閱使用 JDBC 連接到 Amazon Athena使用 ODBC 連接到 Amazon Athena

2021 年 5 月 12 日

2021-05-12 發布

您現在可以使用 Amazon Athena 從您自己的帳戶以外的帳戶註冊 AWS Glue 目錄。設定所需的 IAM 許可後 AWS Glue,您可以使用 Athena 執行跨帳戶查詢。

如需詳細資訊,請參閱從另一個帳戶註冊 AWS Glue Data Catalog跨帳戶存取 AWS Glue 資料目錄

2021 年 5 月 10 日

2021-05-10 發布

發行了 Athena 的 ODBC 驅動程式版本 1.1.9.1001。此版本修正了使用 Azure Active Directory (AD) 時所產生的 BrowserAzureAD 身分驗證類型問題。

若要下載新的驅動程式、版本備註和文件,請參閱使用 ODBC 連接到 Amazon Athena

2021 年 5 月 5 日

2021-05-05 發布

您現在可以在聯合查詢中使用 Amazon Athena Vertica 連接器,從 Athena 查詢 Vertica 資料來源。例如,您可以在 Vertica 上的資料倉儲和 Simple Storage Service (Amazon S3) 中的資料湖上執行分析查詢。

若要部署 Athena Vertica 連接器,請造訪中的AthenaVerticaConnector頁面。 AWS Serverless Application Repository

Amazon Athena Vertica 連接器透過 Lambda 環境變數公開數個組態選項。如需有關組態選項、參數、連接字串、部署和限制的詳細資訊,請參閱 Amazon Athena Vertica 連接器

如需有關使用 Vertica 連接器的深入資訊,請參閱 AWS 大數據部落格中的使用 Athena 聯合查詢軟體開發套件查詢 Amazon Athena 中的 Vertica 資料來源

2021 年 4 月 30 日

2021-04-30 發布

發行了 Athena 的驅動程式 JDBC 2.0.21 和 ODBC 1.1.9。這兩個版本都支援使用 Azure 作用中目錄 (AD) 和 SAML 驗證的 SAML 驗證。 PingFederateJDBC 版本也支援參數化查詢。如需有關 Athena 中參數化查詢的資訊,請參閱使用參數化查詢

若要下載新的驅動程式、版本備註和文件,請參閱使用 JDBC 連接到 Amazon Athena使用 ODBC 連接到 Amazon Athena

2021 年 4 月 29 日

2021-04-29 發布

Amazon Athena 宣佈在中國 (北京) 和中國 (寧夏) 區域提供 Athena 引擎版本 2。

如需有關 Athena 引擎版本 2 的資訊,請參閱Athena 引擎版本 2

2021 年 4 月 26 日

2021-04-26 發布

Athena 引擎版本 2 中的視窗值函數現在支援 IGNORE NULLSRESPECT NULLS

如需詳細資訊,請參閱 Presto 文件中的值函數

2021 年 4 月 21 日

2021-04-21 發布

Amazon Athena 宣佈在歐洲 (米蘭) 和非洲 (開普敦) 區域提供 Athena 引擎版本 2。

如需有關 Athena 引擎版本 2 的資訊,請參閱Athena 引擎版本 2

2021 年 4 月 5 日

2021-04-05 發布

EXPLAIN 陳述式

您現在可以在 Athena 中使用 EXPLAIN 陳述式檢視 SQL 查詢的執行計劃。

如需詳細資訊,請參閱在 Athena 使用 EXPLAIN 和 EXPLAIN ANALYZE了解 Athena EXPLAIN 陳述式結果

SageMaker SQL 查詢中的 Machine Learning 模型

Amazon 的機器學習模型推論現已 SageMaker 正式提供給 Amazon Athena 使用。在 SQL 查詢中使用機器學習模型來簡化複雜的任務,例如異常偵測、客群分析及時間序列預測,只要在 SQL 查詢中叫用函數即可。

如需詳細資訊,請參閱搭配 Amazon Athena 使用機器學習 (ML)

使用者定義函數 (UDF)

使用者定義函數 (UDF) 現在已普遍適用於 Athena。使用 UDF 來利用在單一 SQL 查詢中處理記錄或記錄群組的自訂函數。

如需詳細資訊,請參閱利用使用者定義函數來查詢

2021 年 3 月 30 日

2021-03-30 發布

Amazon Athena 宣佈在亞太區域 (香港) 和中東 (巴林) 區域中提供 Athena 引擎版本 2。

如需有關 Athena 引擎版本 2 的資訊,請參閱Athena 引擎版本 2

2021 年 3 月 25 日

2021-03-25 發布

Amazon Athena 宣佈在歐洲 (斯德哥爾摩) 區域提供 Athena 引擎版本 2。

如需有關 Athena 引擎版本 2 的資訊,請參閱Athena 引擎版本 2

2021 年 3 月 5 日

2021-03-05 發布

Amazon Athena 宣佈在加拿大 (中部)、歐洲 (法蘭克福) 和南美洲 (聖保羅) 區域中提供 Athena 引擎版本 2。

如需有關 Athena 引擎版本 2 的資訊,請參閱Athena 引擎版本 2

2021 年 2 月 25 日

2021-02-25 發布

Amazon Athena 宣佈在亞太區域 (首爾)、亞太區域 (新加坡)、亞太區域 (雪梨)、歐洲 (倫敦) 和歐洲 (巴黎) 區域全面提供 Athena 引擎版本 2。

如需有關 Athena 引擎版本 2 的資訊,請參閱Athena 引擎版本 2

2020 年 Athena 版本備註

2020 年 12 月 16 日

2020-12-16 發布

Amazon Athena 宣布推出 Athena 引擎第 2 版、Athena 聯合查詢和其他 AWS PrivateLink 區域。

Athena 引擎版本 2 和 Athena 聯合查詢

Amazon Athena 宣佈在亞太區域 (孟買)、亞太區域 (東京)、歐洲 (愛爾蘭) 和美國西部 (加利佛尼亞北部) 區域全面提供 Athena 引擎版本 2 和 Athena 聯合查詢。Athena 引擎版本 2 和聯合查詢已在美國東部 (維吉尼亞北部)、美國東部 (俄亥俄州) 和美國西部 (奧勒岡) 區域提供。

如需詳細資訊,請參閱Athena 引擎版本 2使用 Amazon Athena 聯合查詢

AWS PrivateLink 現在,歐洲 (斯德哥爾摩) 地區支援 Athena。如需 Athena AWS PrivateLink 的相關資訊,請參閱使用界面 VPC 端點連接至 Amazon Athena

2020 年 11 月 24 日

2020-11-24 發布

發行了 Athena 的驅動程式 JDBC 2.0.16 和 ODBC 1.1.6。這些版本在帳戶層級支援 Okta Verify 多重要素驗證 (MFA)。您也可以使用 Okta MFA 來設定 SMS 身分驗證和 Google Authenticator 身分驗證作為因素。

若要下載新的驅動程式、版本備註和文件,請參閱使用 JDBC 連接到 Amazon Athena使用 ODBC 連接到 Amazon Athena

2020 年 11 月 11 日

2020-11-11 發布

Amazon Athena 宣佈在美國東部 (維吉尼亞北部)、美國東部 (俄亥俄) 和美國西部 (奧勒岡) 區域全面提供 Athena 引擎版本 2 和聯合查詢。

Athena 引擎版本 2

Amazon Athena 宣佈在美國東部 (維吉尼亞北部)、美國東部 (俄亥俄) 和美國西部 (奧勒岡) 區域全面提供新的查詢引擎版本,即 Athena 引擎版本 2。

Athena 引擎版本 2 包含效能增強功能和新功能,例如 Parquet 格式資料的結構描述演變支援、其他地理空間函數、降低成本的讀取巢狀結構描述之支援,以及 JOIN 和 AGGREGATE 操作的效能增強功能。

聯合 SQL 查詢

現在,您可以在美國東部 (維吉尼亞北部)、美國東部 (俄亥俄) 和美國西部 (奧勒岡) 區域使用 Athena 的聯合查詢,不需要使用 AmazonAthenaPreviewFunctionality 工作群組。

使用聯合 SQL 查詢來針對關聯式、非關聯式、物件和自訂資料來源執行 SQL 查詢。透過聯合查詢,您可以提交單一 SQL 查詢,以掃描內部部署執行或在雲端託管的多個來源的資料。

要跨應用程式對資料執行分析極為複雜,而且耗費時間,原因如下:

  • 分析所需的資料通常分佈在關聯式、金鑰值、文件、記憶體內、搜尋、圖形、物件、時間序列和分類帳資料儲存中。

  • 為了分析這些來源中的資料,分析師建置了複雜的通道來擷取、轉換和載入至資料倉儲中,以便可以查詢資料。

  • 若要從各種來源存取資料,需要學習新的程式設計語言和資料存取結構。

Athena 中的聯合 SQL 查詢允許使用者從資料所在的任何位置就地查詢,從而消除了這種複雜性。分析師可以使用熟悉的 SQL 建構子來 JOIN (聯結) 多個資料來源的資料以進行快速分析,以及將結果存放在 Simple Storage Service (Amazon S3) 中供後續使用。

資料來源連接器

若要處理聯合查詢,Athena 會使用在 AWS Lambda 上執行的 Athena 資料來源連接器。下列開源的、預先建置的連接器由 Athena 寫入和測試。使用它們在 Athena 中針對其對應的資料來源執行 SQL 查詢。

自訂資料來源連接器

使用 Athena Query Federation 軟體開發套件,開發人員可以建立任何資料來源的連接器,讓 Athena 能夠針對該資料來源執行 SQL 查詢。Athena 查詢同盟連接器將聯合查詢的優點延伸到 AWS 提供的連接器之外。由於連接器在上執行 AWS Lambda,因此您不需要管理基礎結構或規劃擴充至尖峰需求。

後續步驟

2020 年 10 月 22 日

2020-10-22 發布

您現在可以打電話給 Athena AWS Step Functions。 AWS Step Functions 可以 AWS 服務 直接使用 Amazon 州語言控制某些。您可以搭配 Athena 使用 Step Functions 來啟動和停止查詢執行、取得查詢結果、執行臨機操作或排程的資料查詢,以及從 Simple Storage Service (Amazon S3) 中的資料湖擷取結果。

如需詳細資訊,請參閱《AWS Step Functions 開發人員指南》中的使用 Step Functions 呼叫 Athena

2020 年 7 月 29 日

2020-07-29 發布

發行了 JDBC 驅動程式版本 2.0.13。此版本支援使用多個在 Athena 註冊的資料目錄、用於身分驗證的 Okta 服務以及連線至 VPC 端點。

若要下載並使用新版驅動程式,請參閱使用 JDBC 連接到 Amazon Athena

2020 年 7 月 9 日

2020-07-09 發布

Amazon Athena 新增查詢壓縮的 Hudi 資料集的支援,並新增 AWS CloudFormation AWS::Athena::DataCatalog資源以建立、更新或刪除您在 Athena 註冊的資料目錄。

查詢 Apache Hudi 資料集

Apache Hudi 是一個開源資料管理架構,可簡化增量資料的處理。Amazon Athena 現在支援在以 Simple Storage Service (Amazon S3) 為基礎的資料湖中查詢 Apache Hudi 資料集的讀取最佳化檢視。

如需詳細資訊,請參閱 使用 Athena 查詢 Apache Hudi 資料集

AWS CloudFormation 資料目錄資源

若要使用 Amazon Athena 的聯合查詢功能查詢任何資料來源,您必須先在 Athena 中註冊資料目錄。您現在可以使用 AWS CloudFormation AWS::Athena::DataCatalog資源來建立、更新或刪除在 Athena 註冊的資料目錄。

如需詳細資訊,請參閱《AWS CloudFormation 使用者指南》中的 AWS::Athena::DataCatalog

2020 年 6 月 1 日

2020-06-01 發布

使用 Apache Hive 中繼存放區作為中繼目錄搭配 Amazon Athena

除了使用 Athena 搭配 AWS Glue Data Catalog 之外,您現在還可以將 Apache 連接至一或多個 Apache Hive 中繼存放區。

若要連接至自我託管的 Hive 中繼存放區,您需要一個 Athena Hive 中繼存放區連接器。Athena 提供參考實作連接器供您使用。連接器在您的帳戶中會作為 AWS Lambda 函數執行。

如需詳細資訊,請參閱將 Athena 資料連接器用於外部 Hive 中繼存放區

2020 年 5 月 21 日

2020-05-21 發布

Amazon Athena 新增了對分割區投影的支援。使用分割區投影可加速高度分割資料表的查詢處理,並自動化分割區管理。如需詳細資訊,請參閱使用 Amazon Athena 進行分割區投影

2020 年 4 月 1 日

2020-04-01 發布

除了美國東部 (維吉尼亞北部) 區域,Amazon Athena 聯合查詢使用者定義函數 (UDF)機器學習推論以及外部 Hive 中繼存放區功能現已在亞太區域 (孟買)、歐洲 (愛爾蘭) 和美國西部 (奧勒岡) 區域以預覽模式提供。

2020 年 3 月 11 日

2020-03-11 發布

Amazon Athena 現在發佈 Amazon EventBridge 事件,以進行查詢狀態 例如,當查詢在狀態之間切換至終端機狀態 (例如「成功」或「已取消-」) 時,Athena 會將查詢狀態變更事件發佈至 EventBridge。該事件包含有關查詢狀態轉換的資訊。如需詳細資訊,請參閱 使用 Amazon EventBridge 事件監控 Athena 查

2020 年 3 月 6 日

2020-03-06 發布

您現在可以使用 AWS CloudFormation AWS::Athena::WorkGroup資源建立和更新 Amazon Athena 工作群組。如需詳細資訊,請參閱《AWS CloudFormation 使用者指南》中的 AWS::Athena::WorkGroup

2019 年 Athena 版本備註

2019 年 11 月 26 日

2019-12-17 發布

Amazon Athena 新增了對以下項目的支援:跨關聯式、非關聯式、物件和自訂資料來源執行 SQL 查詢、在 SQL 查詢中叫用機器學習模型、使用者定義函數 (UDF) (預覽)、使用 Apache Hive 中繼存放區作為 Amazon Athena 的中繼資料目錄 (預覽),以及另外四個查詢相關的指標。

聯合 SQL 查詢

使用聯合 SQL 查詢來針對關聯式、非關聯式、物件和自訂資料來源執行 SQL 查詢。

您現在可以使用 Athena 的聯合查詢來掃描儲存在關聯式、非關聯式、物件和自訂資料來源中的資料。透過聯合查詢,您可以提交單一 SQL 查詢,以掃描內部部署執行或在雲端託管的多個來源的資料。

要跨應用程式對資料執行分析極為複雜,而且耗費時間,原因如下:

  • 分析所需的資料通常分佈在關聯式、金鑰值、文件、記憶體內、搜尋、圖形、物件、時間序列和分類帳資料儲存中。

  • 為了分析這些來源中的資料,分析師建置了複雜的通道來擷取、轉換和載入至資料倉儲中,以便可以查詢資料。

  • 若要從各種來源存取資料,需要學習新的程式設計語言和資料存取結構。

Athena 中的聯合 SQL 查詢允許使用者從資料所在的任何位置就地查詢,從而消除了這種複雜性。分析師可以使用熟悉的 SQL 建構子來 JOIN (聯結) 多個資料來源的資料以進行快速分析,以及將結果存放在 Simple Storage Service (Amazon S3) 中供後續使用。

資料來源連接器

Athena 使用在 AWS Lambda 上執行的 Athena 資料來源連接器來處理聯合查詢。使用這些開放原始碼資料來源連接器,在 Amazon DynamoDB、Apache HBase、Amazon 文件資料庫、Amazon CloudWatch、亞馬遜 CloudWatch 指標以及與 JDBC 相容的關聯式資料庫 (例如 MySQL) 以及 Apache 2.0 授權下的 PostgreSQL 執行聯合 SQL 查詢。

自訂資料來源連接器

使用 Athena Query Federation 軟體開發套件,開發人員可以建立任何資料來源的連接器,讓 Athena 能夠針對該資料來源執行 SQL 查詢。Athena 查詢同盟連接器將聯合查詢的優點延伸到 AWS 提供的連接器之外。由於連接器在上執行 AWS Lambda,因此您不需要管理基礎結構或規劃擴充至尖峰需求。

預覽可用性

Athena 聯合查詢在美國東部 (維吉尼亞北部) 區域以預覽模式提供。

後續步驟

在 SQL 查詢中呼叫機器學習模型

您現在可以叫用機器學習模型,直接從您的 Athena 查詢進行推論。在 SQL 查詢使用機器學習,只要在 SQL 查詢叫用函數就能執行複雜的任務,例如異常偵測、客群分析及銷售預測。

ML 模型

您可以使用 Amazon 提供的十多種內建機器學習演算法 SageMaker、訓練您自己的模型,或尋找並訂閱 Amazon SageMaker 託管服務AWS Marketplace和部署的模型套件。不需要額外的設定。您可以從 Athena 主控台、Athena API,以及 Athena 的預覽 JDBC 驅動程式,在 SQL 查詢中叫用這些機器學習 (ML) 模型。

預覽可用性

Athena 的機器學習 (ML) 功能目前已在美國東部 (維吉尼亞北部) 區域以預覽模式提供。

後續步驟

使用者定義函數 (UDF) (預覽)

您現在可以撰寫自訂純量函數,並在 Athena 查詢中叫用它們。您可以使用 Athena Query Federation 軟體開發套件以 Java 編寫 UDF。在提交至 Athena 的 SQL 查詢中使用 UDF 時,會在 AWS Lambda 上叫用並執行 UDF。UDF 可用於 SQL 查詢的 SELECTFILTER 子句。您可以在相同查詢中叫用多個 UDF。

預覽可用性

Athena UDF 功能在美國東部 (維吉尼亞北部) 區域以預覽模式提供。

後續步驟

使用 Apache Hive 中繼存放區作為中繼目錄搭配 Amazon Athena (預覽)

除了使用 Athena 搭配 AWS Glue Data Catalog 之外,您現在還可以將 Apache 連接至一或多個 Apache Hive 中繼存放區。

中繼存放區連接器

若要連接至自我託管的 Hive 中繼存放區,您需要一個 Athena Hive 中繼存放區連接器。Athena 提供參考實作連接器供您使用。連接器會以您帳戶中的 AWS Lambda 函式執行。如需詳細資訊,請參閱針對外部 Hive 中繼存放區使用 Athena 資料連接器 (預覽)

預覽可用性

Hive 中繼存放區功能在美國東部 (維吉尼亞北部) 區域以預覽模式提供。

後續步驟

新的查詢相關指標

Athena 現在發布可協助您了解 Amazon Athena 效能的其他查詢指標。Athena 向 Amazon 發布與查詢相關的指標。 CloudWatch在此版本中,Athena 發布下列額外的查詢指標:

  • Query Planning Time (查詢規劃時間) – 規劃查詢所花費的時間。這包括從資料來源擷取資料表分割區所花費的時間。

  • Query Queuing Time (查詢佇列時間) – 查詢在佇列中等待資源的時間。

  • Service Processing Time (服務處理時間) – 查詢引擎完成處理後寫入結果所需的時間。

  • Total Execution Time (總執行期) – Athena 執行查詢所花費的時間。

若要使用這些新的查詢指標,您可以建立自訂儀表板、在中設定指標的警示和觸發器 CloudWatch,或直接從 Athena 主控台使用預先填入的儀表板。

後續步驟

如需詳細資訊,請參閱使用 CloudWatch 指標監控 Athena 查詢

2019 年 11 月 12 日

2019-12-17 發布

Amazon Athena 現已在中東 (巴林) 區域提供。

2019 年 11 月 8 日

2019-12-17 發布

Amazon Athena 現已在美國西部 (加利佛尼亞北部) 區域和歐洲 (巴黎) 區域提供。

2019 年 10 月 8 日

2019-12-17 發布

Amazon Athena 現在可讓您透過 Virtual Private Cloud (VPC) 中的界面 VPC 端點直接連接至 Athena。使用這項功能,您可以安全地將查詢提交到 Athena,無需在 VPC 中使用網際網路閘道。

若要建立連線至 Athena 的介面 VPC 端點,您可以使用 AWS Management Console 或 AWS Command Line Interface (AWS CLI)。如需建立介面端點的詳細資訊,請參閱建立界面端點

當您使用介面虛擬私人雲端端點時,VPC 和 Athena API 之間的通訊是安全的,並保持在網路中 AWS 。使用此功能無需支付額外的 Athena 費用。必須支付界面 VPC 端點費用

若要進一步了解此功能,請參閱使用界面 VPC 端點連接至 Amazon Athena

2019 年 9 月 19 日

2019-12-17 發布

Amazon Athena 新增了對使用 INSERT INTO 陳述式將新資料插入現有資料表的支援。您可以根據在來源表格上執行的 SELECT 查詢陳述式,或根據提供作為查詢陳述式一部分的一組值,將新資料行插入目的地表格。支援的資料格式包含 Avro、JSON、ORC、Parquet 和文字檔案。

INSERT INTO 陳述式也能協助您簡化 ETL 程序。例如,您可以在單一查詢中使用 INSERT INTO 從 JSON 格式的來源表格選取資料,再將資料寫入 Parquet 格式的目的地表格。

INSERT INTO 陳述式會根據 SELECT 階段中掃描的位元組數收費,類似於 Athena 針對 SELECT 查詢的收費方式。如需詳細資訊,請參閱 Amazon Athena 定價

如需使用INSERT INTO的詳細資訊 (包括支援的格式 SerDes 和範例),請參閱 Athena 使用手冊中的插入

2019 年 9 月 12 日

2019-12-17 發布

Amazon Athena 現已在亞太區域 (香港) 區域提供。

2019 年 8 月 16 日

2019-12-17 發布

Amazon Athena 新增了對在 Simple Storage Service (Amazon S3) 申請者付款儲存貯體中查詢資料的支援。

當 Simple Storage Service (Amazon S3) 儲存貯體設定為 Requester Pays (申請者付款) 時,請求者 (而非儲存貯體擁有者) 會支付 Simple Storage Service (Amazon S3) 請求與資料傳輸的費用。在 Athena 中,工作群組管理員現在可以設定工作群組設定,以允許工作群組成員查詢 S3 申請者付款儲存貯體。

如需有關如何為您的工作群組設定 Requester Pays (申請者付款) 設定的資訊,請參閱《Amazon Athena 使用者指南》中的建立工作群組。如需有關申請者付款儲存貯體的詳細資訊,請參閱《Amazon Simple Storage Service 開發人員指南》中的申請者付款儲存貯體

2019 年 8 月 9 日

2019-12-17 發布

Amazon Athena 現在支援強制執行 AWS Lake Formation 政策,這些政策針對存放在 Simple Storage Service (Amazon S3) 中的資料在新的或現有的資料庫、資料表和 AWS Glue Data Catalog 中定義的資料欄進行精細存取控制。

您可以在下列項目中使用此功能 AWS 區域:美國東部 (俄亥俄)、美國東部 (維吉尼亞北部)、美國西部 (奧勒岡)、亞太區域 (東京) 和歐洲 (愛爾蘭)。使用此功能無須額外付費。

如需使用此功能的詳細資訊,請參閱 使用 Athena 查詢向 AWS Lake Formation註冊的資料 一文。如需有關 AWS Lake Formation的詳細資訊,請參閱《AWS Lake Formation》。

2019 年 6 月 26 日

Amazon Athena 現在已在歐洲 (斯德哥爾摩) 區域提供。如需支援區域的清單,請參閱 AWS 區域 和節點

2019 年 5 月 24 日

2019-05-24 發布

Amazon Athena 現在可在 AWS GovCloud (美國東部) 和 AWS GovCloud (美國西部) 區域使用。如需支援區域的清單,請參閱 AWS 區域 和節點

2019 年 3 月 5 日

2019-03-05 發布

Amazon Athena 現已在加拿大 (中部) 區域提供。如需支援區域的清單,請參閱 AWS 區域 和節點。發布了支援 Athena 工作群組的新版 ODBC 驅動程式。如需詳細資訊,請參閱 ODBC 驅動程式版本備註

若要下載 ODBC 驅動程式 1.0.5 版及其文件,請參閱使用 ODBC 連接到 Amazon Athena。如需此版本的相關資訊,請參閱 ODBC 驅動程式版本備註

若要使用工作群組搭配 ODBC 驅動程式,請在連線字串中設定新的連線屬性 Workgroup,如下所示:

Driver=Simba Athena ODBC Driver;AwsRegion=[Region];S3OutputLocation=[S3Path];AuthenticationType=IAM Credentials;UID=[YourAccessKey];PWD=[YourSecretKey];Workgroup=[WorkgroupName]

如需詳細資訊,請在 ODBC 驅動程式安裝和組態指南 1.0.5 版中搜尋「工作群組」。當您在工作群組上使用標籤時,ODBC 驅動程式連線字串沒有變更。若要使用標籤,請升級到最新版本的 ODBC 驅動程式 (目前的版本)。

此驅動程式版本可讓您使用 Athena API 工作群組動作建立和管理工作群組,並使用 Athena API 標籤動作在工作群組上新增、列出或移除標籤。開始之前,請確定您在 IAM 中有資源層級許可,而能夠對工作群組和標籤執行動作。

如需詳細資訊,請參閱:

如果您使用 JDBC 驅動程式或 AWS SDK,請升級至最新版本的驅動程式和 SDK,這兩個版本都已包含對 Athena 中工作群組和標籤的支援。如需詳細資訊,請參閱 使用 JDBC 連接到 Amazon Athena

2019 年 2 月 22 日

2019-02-22 發布

對 Amazon Athena 中的工作群組新增了標籤支援。每個標記皆包含由您定義的金鑰和值。當您標記工作群組時,您可以指派自訂中繼資料給它。您可以使 AWS 用標籤佳實踐,將標籤加入至工作群組以協助對其進行分類。您可以使用標籤來限制存取工作群組和追蹤成本。例如,為每個成本中心建立工作群組。然後,您可以將標籤新增到工作群組,以追蹤每個成本中心的 Athena 花費。如需詳細資訊,請參閱《AWS Billing and Cost Management 使用者指南》中的使用標籤計費

您可以使用 Athena 主控台或 API 操作來處理標籤。如需詳細資訊,請參閱 標記 Athena 資源

在 Athena 主控台中,您可以將一或多個標籤新增到每個工作群組,並依標籤來搜尋。工作群組在 Athena 中是 IAM 控制的資源。在 IAM 中,您可以限制誰可以在您建立的工作群組上新增、移除或列出標籤。您也可以使用具有選用標籤參數的 CreateWorkGroup API 操作,將一或多個標籤新增到工作群組。若要新增、移除或列出標籤,請使用 TagResourceUntagResourceListTagsForResource。如需詳細資訊,請參閱 使用標籤操作

若要允許使用者在建立工作群組時新增標籤,請確保將 TagResourceCreateWorkGroup API 動作的 IAM 許可給予每個使用者。如需詳細資訊和範例,請參閱 標籤型 IAM 存取控制政策

當您在工作群組上使用標籤時,JDBC 驅動程式沒有變更。如果您建立新的工作群組並使用 JDBC 驅動程式或 AWS SDK,請升級至最新版本的驅動程式和 SDK。如需相關資訊,請參閱使用 JDBC 連接到 Amazon Athena

2019 年 2 月 18 日

2019-02-18 發布

新增能夠在工作群組中執行查詢來控制查詢成本。如需相關資訊,請參閱 使用工作群組來控制查詢存取和成本。改善 Athena 中 SerDe 使用的 JSON OpenX,修正 Athena 未忽略轉換至GLACIER儲存區類別的物件的問題,並新增查詢 Network Load Balancer 記錄的範例。

進行下列變更:

  • 新增支援工作群組。使用工作群組來區隔使用者、團隊、應用程式或工作負載,以及對每個查詢或整個工作群組可以處理的資料量設定限制。因為工作群組扮演 IAM 資源的角色,所以您可以使用資源層級許可來控制對特定工作群組的存取。您也可以在 Amazon 中檢視查詢相關指標 CloudWatch、透過設定掃描的資料量限制來控制查詢成本、建立閾值,以及在超出這些閾值時觸發動作 (例如 Amazon SNS 警示)。如需詳細資訊,請參閱使用工作群組來執行查詢使用指標和事件控制成本並 CloudWatch 監控查詢

    工作群組是 IAM 資源。如需 IAM 中與工作群組相關的動作、資源和條件的完整清單,請參閱《服務授權參考》中的適用於 Amazon Athena 的動作、資源及條件索引鍵。建立新的工作群組之前,請確保使用工作群組 IAM 政策AWS 受管政策:AmazonAthenaFullAccess

    您可以在主控台、透過工作群組 API 操作或透過 JDBC 驅動程式來開始使用工作群組。如需高階程序,請參閱設定工作群組。若要下載具有工作群組支援的 JDBC 驅動程式,請參閱使用 JDBC 連接到 Amazon Athena

    如果您使用工作群組搭配 JDBC 驅動程式,您必須在連線字串中使用 Workgroup 組態參數來設定工作群組名稱,如下列範例所示:

    jdbc:awsathena://AwsRegion=<AWSREGION>;UID=<ACCESSKEY>; PWD=<SECRETKEY>;S3OutputLocation=s3://<athena-output>-<AWSREGION>/; Workgroup=<WORKGROUPNAME>;

    您對驅動程式執行 SQL 陳述式或進行 JDBC API 呼叫的方式沒有變更。驅動程式會將工作群組名稱傳遞給 Athena。

    如需工作群組所造成差異的相關資訊,請參閱 Athena 工作群組 API工作群組疑難排解

  • 改進了在 Athena SerDe 使用的 JSON OpenX。改善功能包括 (但不限於) 下列各項:

    • 支援 ConvertDotsInJsonKeysToUnderscores 屬性。當設定為時TRUE,它允許 SerDe 用底線取代關鍵名稱中的點。例如,如果 JSON 資料集包含名稱為 "a.b" 的索引鍵,您可以使用此屬性在 Athena 中將資料欄名稱定義為 "a_b"。預設值為 FALSE。在預設情況下,Athena 在資料欄名稱中不允許點。

    • 支援 case.insensitive 屬性。在預設情況下,Athena 規定 JSON 資料集裡的所有索引鍵必須使用小寫。使用 WITH SERDE PROPERTIES ("case.insensitive"= FALSE;) 可讓您在資料中使用區分大小寫的索引鍵名稱。預設值為 TRUE。設定為時TRUE,會 SerDe 將所有大寫欄轉換為小寫。

    如需詳細資訊,請參閱 OpenX JSON SerDe

  • 修正了 Athena 在處理依 Simple Storage Service (Amazon S3) 生命週期政策而存檔到 Glacier 的 Simple Storage Service (Amazon S3) 物件時傳回 "access denied" 錯誤訊息這個問題。修正此問題後,Athena 會忽略轉換到 GLACIER 儲存類別的物件。Athena 不支援從 GLACIER 儲存類別來查詢資料。

    如需詳細資訊,請參閱《Amazon Simple Storage Service 使用者指南》中的 Athena 資料表和 Amazon S3 資料的要求轉換為 GLACIER 儲存類別 (物件存檔)

  • 新增了如何查詢 Network Load Balancer 存取日誌的範例,這些日誌接收 Transport Layer Security (TLS) 請求的相關資訊。如需詳細資訊,請參閱 查詢 Network Load Balancer 日誌

2018 年 Athena 版本備註

2018 年 11 月 20 日

2018-11-20 發布

發行了新版本的 JDBC 和 ODBC 驅動程式,支援透過 AD FS 和 SAML 2.0 (安全性聲明標記語言 2.0) 來聯合存取 Athena API。如需詳細資訊,請參閱 JDBC 驅動程式版本備註ODBC 驅動程式版本備註

在此版本中,支援 Active Directory Federation Service (AD FS 3.0) 聯合存取 Athena。透過支援 SAML 2.0 的 JDBC 或 ODBC 驅動程式版本建立存取權。如需有關設定聯合存取 Athena API 的資訊,請參閱啟用對 Athena API 的聯合存取

若要下載 JDBC 驅動程式 2.0.6 版及其文件,請參閱使用 JDBC 連接到 Amazon Athena。如需此版本的詳細資訊,請參閱 JDBC 驅動程式版本備註

若要下載 ODBC 驅動程式 1.0.4 版及其文件,請參閱使用 ODBC 連接到 Amazon Athena。如需此版本的詳細資訊,請參閱 ODBC 驅動程式版本備註

如需有關中的 SAML 2.0 支援的詳細資訊 AWS,請參閱《IAM 使用者指南》中的關於 SAML 2.0 同盟

2018 年 10 月 15 日

2018-10-15 發布

如果您已升級至 AWS Glue Data Catalog,則有兩個新功能可提供以下支援:

  • 資料目錄中繼資料的加密。如果您選擇加密資料目錄中的中繼資料,您必須將特定的政策新增至 Athena。如需詳細資訊,請參閱存取 AWS Glue Data Catalog中的加密中繼資料

  • 存取中資源的 AWS Glue Data Catalog精細權限。您現在可以定義身分型 (IAM) 政策,以限制或允許從 Athena 中使用的資料目錄存取特定的資料庫和資料表。如需詳細資訊,請參閱 AWS Glue Data Catalog 中資料庫和資料表的精細存取

    注意

    資料位於 Amazon S3 儲存貯體中,而其存取權取決於 存取 Amazon S3。若要存取資料庫和資料表中的資料,請繼續對存放資料的 Simple Storage Service (Amazon S3) 儲存貯體使用存取控制政策。

2018 年 10 月 10 日

2018-10-10 發布

Athena 支援 CREATE TABLE AS SELECT,它會根據 SELECT 查詢陳述式的結果建立資料表。如需詳細資訊,請參閱從查詢結果建立資料表 (CTAS)

建立 CTAS 查詢之前,請務必在 Athena 文件中了解其行為。其中包含有關將查詢結果儲存在 Simple Storage Service (Amazon S3) 中的位置、支援存放 CTAS 查詢結果的格式清單、您可以建立的分割區數目,以及支援的壓縮格式等資訊。如需詳細資訊,請參閱 CTAS 查詢的考量事項與限制

使用 CTAS 查詢來:

2018 年 9 月 6 日

2018-09-06 發布

發行新版本的 ODBC 驅動程式 (1.0.3 版)。新版本的 ODBC 驅動程式預設會串流結果,而不會翻頁瀏覽,這樣可讓商業智慧工具更快擷取大型資料集。此版本還包括改善功能、錯誤修正,以及使用 SSL 搭配代理伺服器的更新文件。如需詳細資訊,請參閱驅動程式的版本備註

若要下載 ODBC 驅動程式 1.0.3 版及其文件,請參閱使用 ODBC 連接到 Amazon Athena

串流結果功能適用於此新版本的 ODBC 驅動程式。也適用於 JDBC 驅動程式。如需串流結果的相關資訊,請參閱《ODBC 驅動程式安裝和設定指南》,然後搜尋UseResultsetStreaming

ODBC 驅動程式 1.0.3 版直接取代舊版的驅動程式。建議您遷移到最新的驅動程式。

重要

若要使用 ODBC 驅動程式 1.0.3 版,請依照以下要求:

  • 連接埠 444 保持開放給傳出流量。

  • 在 Athena 的政策清單中新增 athena:GetQueryResultsStream 政策動作。此政策動作不會直接透過 API 公開,只能用於 ODBC 和 JDBC 驅動程式,做為串流結果支援的一部分。如需政策範例,請參閱 AWS 受管政策:AWSQuicksightAthenaAccess

2018 年 8 月 23 日

2018-08-23 發布

增加支援這些 DDL 相關功能並修正幾個錯誤,如下所示:

  • 對於 Parquet 的資料,增加支援 BINARYDATE 資料類型,對於 Avro 的資料,增加支援 DATETIMESTAMP 資料類型。

  • 在 DDL 查詢中增加支援 INTDOUBLEINTEGERINT 的別名,DOUBLE PRECISIONDOUBLE 的別名。

  • 已改進 DROP DATABASEDROP TABLE 查詢的效能。

  • 當資料儲存貯體是空的時,不再於 Simple Storage Service (Amazon S3) 中建立 _$folder$ 物件。

  • 修正在未提供分割區值時 ALTER TABLE ADD PARTITION 擲出錯誤的問題。

  • 修正在陳述式中指定合格名稱之後 DROP TABLE 檢查分割區時忽略資料庫名稱的問題。

如需有關 Athena 中支援的資料類型的詳細資訊,請參閱Amazon Athena 中的資料類型

如需有關 Athena、JDBC 驅動程式和 Java 資料類型之間支援之資料類型映射的資訊,請參閱《JDBC 驅動程式安裝和設定指南》https://downloads.athena.us-east-1.amazonaws.com/drivers/JDBC/SimbaAthenaJDBC_2.0.5/docs/Simba+Athena+JDBC+Driver+Install+and+Configuration+Guide.pdf中的「資料類型」一節。

2018 年 8 月 16 日

2018-08-16 發布

發行 JDBC 驅動程式 2.0.5 版。新版本的 JDBC 驅動程式預設會串流結果,而不會翻頁瀏覽,這樣可讓商業智慧工具更快擷取大型資料集。相較於舊版的 JDBC 驅動程式,有以下效能改良:

  • 在擷取不超過 10K 個資料行時,效能增加大約 2 倍。

  • 在擷取超過 10K 個資料行時,效能增加大約 5-6 倍。

串流結果功能僅適用於 JDBC 驅動程式。不適用於 ODBC 驅動程式。不能搭配 Athena API 一起使用。如需有關串流結果的資訊,請參閱《JDBC 驅動程式安裝和組態指南》,然後搜尋UseResultsetStreaming

若要下載 JDBC 驅動程式 2.0.5 版及其文件,請參閱使用 JDBC 連接到 Amazon Athena

JDBC 驅動程式 2.0.5 版直接取代舊版的驅動程式 (2.0.2)。為確保您可以使用 JDBC 驅動程式 2.0.5 版,請將 athena:GetQueryResultsStream 政策動作新增至 Athena 的政策清單。此政策動作不會直接透過 API 公開,只能用於 JDBC 驅動程式,做為串流結果支援的一部分。如需政策範例,請參閱 AWS 受管政策:AWSQuicksightAthenaAccess如需從驅動程式 2.0.2 版遷移至 2.0.5 版的詳細資訊,請參閱 JDBC 驅動程式遷移指南

如果您是從 1.x 驅動程式遷移到 2.x 驅動程式,您需要將現有的設定遷移到新的設定。強烈建議您遷移到最新版的驅動程式。如需詳細資訊,請參閱 JDBC 驅動程式遷移指南

2018 年 8 月 7 日

2018-08-07 發布

您現在可以將 Amazon Virtual Private Cloud 流程日誌以 GZIP 格式直接存放在 Simple Storage Service (Amazon S3) 中,然後在 Athena 中查詢它們。如需相關資訊,請參閱查詢 Amazon VPC 流程日誌Amazon VPC Flow Logs 現在可以傳遞至 S3

2018 年 6 月 5 日

2018-06-05 發布

支援檢視

新增了對檢視的支援。您現在可以在 Athena 中使用 CREATE VIEWDESCRIBE VIEWDROP VIEWSHOW CREATE VIEWSHOW VIEWS。您在查詢中每次參考檢視時,定義該檢視的查詢就會執行。如需詳細資訊,請參閱使用檢視

改善和更新錯誤訊息

  • 在中包含 GSON 2.8.0 程式庫 CloudTrail SerDe,以解決 JSON 字串的問題, CloudTrail SerDe 並啟用剖析 JSON 字串。

  • 在 Athena 中增強了對於 Parquet 的分割區結構描述驗證,在某些情況下允許重新排序資料欄,以適用於 ORC。這使 Athena 能夠更好地處理結構描述演進隨著時間的變化,以及 AWS Glue 爬行者程式新增的表格。如需詳細資訊,請參閱 處理結構描述更新

  • 增加對 SHOW VIEWS 的剖析支援。

  • 對最常見的錯誤訊息做出以下改進:

    • 在 Athena 查詢中剖析資料行 SerDe 失敗時,將內部錯誤訊息取代為描述性錯誤訊息。以前,Athena 在剖析錯誤的情況下會發出內部錯誤。新的錯誤訊息是:「HIVE_BAD_DATA:剖析欄位 0 的欄位值時發生錯誤:java.lang.String 無法轉換為 org.openx.data.jsonserde.json.JSONObject」

    • 新增更多詳細資訊以改善有關許可不足的錯誤訊息。

錯誤修正

修正以下錯誤:

  • 修正內部可能將 REAL 轉譯為 FLOAT 資料類型的問題。這可改善與 AWS Glue 爬蟲程式 (傳回 FLOAT 資料類型) 之間的整合。

  • 修正了 Athena 未將 AVRO DECIMAL (邏輯類型) 轉換為 DECIMAL 類型的問題。

  • 修正了以 WHERE 子句參考 TIMESTAMP 資料類型的值來查詢 Parquet 資料時,Athena 未傳回結果的問題。

2018 年 5 月 17 日

2018-05-17 發布

將 Athena 中的查詢並行配額從 5 提高到了 20。這表示您一次可以提交和執行最多 20 個 DDL 查詢和 20 個 SELECT 查詢。請注意,DDLSELECT 查詢有個別的並行配額。

Athena 中的並行配額定義為可同時提交到服務的查詢次數。您一次最多可以提交 20 個相同類型 (DDLSELECT) 的查詢。如果您提交的查詢超過並行查詢配額,則 Athena API 會顯示錯誤訊息。

當您將查詢提交到 Athena 之後,它會根據整體服務負載和傳入的請求數量,指派資源來處理查詢。我們會持續監控並調整服務,讓您的查詢能夠儘快處理。

如需相關資訊,請參閱 Service Quotas。這是可調整的配額。您可以使用 Service Quotas 主控台來要求提高並行查詢的配額。

2018 年 4 月 19 日

2018-04-19 發布

發行新版本的 JDBC 驅動程式 (2.0.2 版),支援以陣列資料類型傳回 ResultSet 資料、改進功能和錯誤修正。如需詳細資訊,請參閱驅動程式的版本備註

如需有關下載新的 JDBC 驅動程式 2.0.2 版及其文件的資訊,請參閱使用 JDBC 連接到 Amazon Athena

JDBC 驅動程式的最新版本為 2.0.2。如果您是從 1.x 驅動程式遷移到 2.x 驅動程式,您需要將現有的設定遷移到新的設定。強烈建議您遷移到最新的驅動程式。

如需有關新版本的驅動程式中引進的變更、版本差異和範例的資訊,請參閱 JDBC 驅動程式遷移指南

2018 年 4 月 6 日

2018-04-06 發布

在 Athena 主控台中使用自動完成輸入查詢。

2018 年 3 月 15 日

2018-03-15 發布

新增直接從 CloudTrail 主控台為 CloudTrail 記錄檔自動建立 Athena 資料表的功能。如需相關資訊,請參閱使用主 CloudTrail 控台為 CloudTrail 記錄建立 Athena 資料表

2018 年 2 月 2 日

2018-02-12 發布

新增針對使用 GROUP BY 子句的記憶體密集型查詢,安全地將中繼資料卸載到磁碟的支援。這可以改善這類查詢的可靠性,防止 "Query resource exhausted" (「查詢資源耗盡」) 錯誤。

2018 年 1 月 19 日

2018-01-19 發布

Athena 使用開源分散式查詢引擎 Presto 來執行查詢。

使用 Athena 時,不需要管理版本。我們以透明方式將 Athena 中的基礎引擎升級到基於 Presto 0.172 版的版本。您不需要進行任何動作。

透過這次升級,您現在可以使用 Presto 0.172 函數和運算子,包括 Athena 中的 Presto 0.172 lambda 表達式。

此版本的主要更新 (包括社群貢獻的修正) 包括:

  • 支援忽略標頭。您在定義資料表時可以使用 skip.header.line.count 屬性,以允許 Athena 忽略標頭。這適用於使用LazySimpleSerDeOpenCSV 的查詢 SerDe,而不適用於 Grok 或正則表達式。 SerDes

  • STRING 函數中支援 CHAR(n) 資料類型。CHAR(n) 的範圍是 [1.255],而 VARCHAR(n) 的範圍是 [1,65535]

  • 支援相互關聯的子查詢。

  • 支援 Presto Lambda 表達式和函數。

  • 提升 DECIMAL 類型和運算子的效能。

  • 支援篩選的彙總,例如 SELECT sum(col_name) FILTER,其中 id > 0

  • 降低 DECIMALTINYINTSMALLINTREAL 資料類型的述詞。

  • 支援量化比較述詞:ALLANYSOME

  • 新增函數:arrays_overlap()array_except()levenshtein_distance()codepoint()skewness()kurtosis()typeof()

  • 新增另一版的 from_unixtime() 函數,可接受時區引數。

  • 新增 bitwise_and_agg()bitwise_or_agg() 彙總函數。

  • 新增了 xxhash64()to_big_endian_64() 函數。

  • json_extract()json_extract_scalar() 函數,使用反斜線加上 JSON 路徑上標,以增加支援逸出雙引號或雙反斜線。對於任何使用反斜線的叫用,這使得語意改變,因為反斜線在以前視為一般字元。

如需有關函數和運算子的詳細資訊,請參閱本指南中的 DML 查詢、函數和運算子,以及 Presto 文件中的函數和運算子

Athena 不支援 Presto 的所有功能。如需詳細資訊,請參閱限制

2017 年 Athena 版本備註

2017 年 11 月 13 日

2017-11-13 發布

已新增將 Athena 連接到 ODBC 驅動程式的支援。如需相關資訊,請參閱 使用 ODBC 連接到 Amazon Athena

2017 年 11 月 1 日

2017-11-01 發布

增加支援查詢地理空間資料,也增加支援亞太區域 (首爾)、亞太區域 (孟買) 和歐洲 (倫敦) 區域。如需相關資訊,請參閱查詢地理空間資料AWS 區域 與端點

2017 年 10 月 19 日

2017-10-19 發布

增加支援歐洲 (法蘭克福)。如需支援區域的清單,請參閱 AWS 區域 與端點

2017 年 10 月 3 日

2017-10-03 發布

使用建立命名的 Athena 查詢 AWS CloudFormation。如需詳細資訊,請參閱《AWS CloudFormation 使用者指南》中的 AWS::Athena::NamedQuery

2017 年 9 月 25 日

2017-09-25 發布

新增了對亞太區域 (雪梨) 的支援。如需支援區域的清單,請參閱 AWS 區域 與端點

2017 年 8 月 14 日

2017-08-14 發布

已新增與 AWS Glue Data Catalog 和移轉精靈的整合,可將 Athena 受管理的資料目錄更新至 AWS Glue Data Catalog. 如需詳細資訊,請參閱 與 AWS Glue 的整合

2017 年 8 月 4 日

2017-08-04 發布

增加了對 Grok 的支持 SerDe,該功能為非結構化文本文件(例如日誌)中的記錄提供了更容易的模式匹配。如需詳細資訊,請參閱 Grok SerDe。新增鍵盤捷徑,可使用主控台 (Windows 使用 CTRL+⇧/⇩,Mac 使用 CMD+⇧/⇩) 來捲動查詢歷史記錄。

2017 年 6 月 22 日

2017-06-22 發布

新增了對亞太區域 (東京) 和亞太區域 (新加坡) 的支援。如需支援區域的清單,請參閱 AWS 區域 與端點

2017 年 6 月 8 日

2017-06-08 發布

新增了對歐洲 (愛爾蘭) 的支援。如需詳細資訊,請參閱 AWS 區域 和端點

2017 年 5 月 19 日

2017-05-19 發布

添加了亞馬遜 Athena API 和對雅典娜的 AWS CLI 支持;更新 JDBC 驅動程序到 1.1.0 版本; 修復了各種問題。

  • Amazon Athena 支援為 Athena 設計應用程式。如需詳細資訊,請參閱《Amazon Athena API 參考》。最新的 AWS 開發套件包括對 Athena API 的支援。如需文件和下載的連結,請參閱適用於 Amazon Web Services 的工具中的軟體開發套件一節。

  • 包 AWS CLI 括 Athena 的新命令。如需詳細資訊,請參閱《Amazon Athena API 參考》。

  • 有新的 JDBC 驅動程式 1.1.0 可用,支援新的 Athena API 及最新的功能和錯誤修正。請到此處下載驅動程式:https://downloads.athena.us-east-1.amazonaws.com/drivers/AthenaJDBC41-1.1.0.jar. 建議升級到最新的 Athena JDBC 驅動程式;不過,您仍可繼續使用舊的驅動程式版本。舊的驅動程式版本不支援 Athena API。如需詳細資訊,請參閱使用 JDBC 連接到 Amazon Athena

  • 舊版 Athena 中專用於政策陳述式的動作已淘汰。如果您升級到 JDBC 驅動程式 1.1.0 版,並將客戶受管或內嵌 IAM 政策連接到 JDBC 使用者,則必須更新 IAM 政策。反之,舊版的 JDBC 驅動程式不支援 Athena API,因此,在連接到舊版 JDBC 使用者的政策中,您只能指定已淘汰的動作。因此,您應該不需要更新客戶受管或內嵌 IAM 政策。

  • 在 Athena API 發行之前,Athena 中使用這些政策特定動作。政策中這些已淘汰的動作,適用於 1.1.0 版以前的 JDBC 驅動程式。如果您正在升級 JDBC 驅動程式,請將允許或拒絕淘汰動作的政策陳述式,取代為列出的適當 API 動作,否則會發生錯誤:

已淘汰的政策特定動作 對應的 Athena API 動作
athena:RunQuery
athena:StartQueryExecution
athena:CancelQueryExecution
athena:StopQueryExecution
athena:GetQueryExecutions
athena:ListQueryExecutions

改善項目

  • 查詢字串長度限制提高到 256 KB。

錯誤修正

  • 修正在主控台上捲動結果時導致查詢結果看似格式不正確的問題。

  • 修正 Simple Storage Service (Amazon S3) 資料檔案中的 \u0000 字元字串會造成錯誤的問題。

  • 修正透過 JDBC 驅動程式來請求取消查詢時導致失敗的問題。

  • 修正美國東部 (俄亥俄) 的 Amazon S3 資料失敗的問題。 AWS CloudTrail SerDe

  • 修正導致 DROP TABLE 在分割資料表上失敗的問題。

2017 年 4 月 4 日

2017-04-04 發布

增加支援 Simple Storage Service (Amazon S3) 資料加密,並發行 JDBC 驅動程式更新 (1.0.1 版) 來提供加密支援、改進功能和錯誤修正。

功能

  • 新增以下加密功能:

    • 支援在 Simple Storage Service (Amazon S3) 中查詢加密資料。

    • 支援加密 Athena 查詢結果。

  • 新版本的驅動程式支援新的加密功能、新增改進功能並修正問題。

  • 新增使用 ALTER TABLE 來新增、取代和變更資料欄的支援。如需詳細資訊,請參閱 Hive 文件中的更改資料欄

  • 增加支援查詢 LZO 壓縮資料。

如需詳細資訊,請參閱 靜態加密

改善項目

  • 經由改善分頁大小以提高 JDBC 查詢效能,可傳回 1,000 個資料行而不是 100 個資料行。

  • 增加支援使用 JDBC 驅動程式界面來取消查詢。

  • 增加支援在 JDBC 連線 URL 中指定 JDBC 選項。關於最新的 JDBC 驅動程式,請參閱 使用 JDBC 連接到 Amazon Athena

  • 在驅動程序中添加了代理設置,現在可以在 Java 的 AWS SDK ClientConfiguration中進行設置。

錯誤修正

修正以下錯誤:

  • 使用 JDBC 驅動程式界面發出多個查詢會發生節流錯誤。

  • 投射小數點資料類型時,JDBC 驅動程式會停止。

  • 無論資料表中如何定義資料類型,JDBC 驅動程式會以字串傳回每個資料類型。例如,使用 INT 選取定義為 resultSet.GetObject() 資料類型的資料欄會傳回 STRING 資料類型,而不是 INT

  • JDBC 驅動程式會在建立連線時驗證登入資料,而不是在執行查詢時。

  • 當結構描述連同 URL 一起指定時,透過 JDBC 驅動程式提出的查詢會失敗。

2017 年 3 月 24 日

2017-03-24 發布

添加了 AWS CloudTrail SerDe,改進的性能,固定的分區問題。

功能

改善項目

  • 改進了掃描大量分割區時的效能。

  • 改進了 MSCK Repair Table 操作的效能。

  • 增加了查詢主要區域以外的區域中存放的 Simple Storage Service (Amazon S3) 資料的功能。除了標準 Athena 費用,也要支付 Simple Storage Service (Amazon S3) 的標準跨區域資料傳輸費用。

錯誤修正

  • 修正未載入分割區時可能發生「找不到資料表錯誤」的錯誤。

  • 修正錯誤以避免 ALTER TABLE ADD PARTITION IF NOT EXISTS 查詢擲回例外狀況。

  • 修正 DROP PARTITIONS 中的錯誤。

2017 年 2 月 20 日

2017-02-20 發布

已新增對 AvroSerDe 和 OpenCSV SerDe、美國東部 (俄亥俄) 區域的支援,以及主控台精靈中的大量編輯欄。改進大型 Parquet 資料表的效能。

功能

  • 推出了對新的支持 SerDes:

  • 美國東部 (俄亥俄) 區域 (us-east-2) 啟動。您現在可以在此區域中執行查詢。

  • 現已可使用從 S3 儲存貯體資料建立資料表方式來大量定義資料表的結構描述。在查詢編輯器中,選擇 Create (建立)、S3 bucket data (S3 儲存貯體資料),然後選擇 Column details (資料欄詳細資訊) 部分的 Bulk add columns (大量新增欄)。

    
                            大量新增欄選項。

    在文字方塊中輸入名稱/值對,然後選擇 Add (新增)

    
                            大量新增欄文字方塊。

改善項目

  • 改進大型 Parquet 資料表的效能。