查詢 S3 快速單區資料 - Amazon Athena

本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。

查詢 S3 快速單區資料

Amazon S3 Express 單區域儲存類別是一種高效能 Amazon S3 儲存類別,可提供延遲不到 10 毫秒的回應時間。因此,對於經常以每秒數十萬個請求存取資料的應用程式而言非常有用。

S3 Express 單區域會在相同的可用區域內複寫和存放資料,以最佳化速度和成本。這與 Amazon S3 區域儲存類別不同,它們會自動跨至少三個 AWS 可用區域複寫資料 AWS 區域。

如需詳細資訊,請參閱《Amazon S3 使用者指南》中的什麼是 S3 Express 單區域?

必要條件

請確認滿足下列條件再開始:

  • Athena 引擎第 3 版 — 若要搭配 Athena 使用 S3 Express 單一區域SQL,您的工作群組必須設定為使用 Athena 引擎第 3 版。

  • S3 Express 單區域許可 – 當 S3 Express 單區域在 Amazon S3 物件上呼叫 GETLISTPUT 等動作,儲存類別會代表您呼叫 CreateSession。基於這個原因,您的原IAM則必須允許s3express:CreateSession動作,讓 Athena 呼叫對應的API作業。

考量與限制

當您使用 Athena 查詢 S3 Express 單區域時,請考慮下列幾點。

  • S3 Express 單區域儲存貯體僅支援 SSE_S3 加密。無論您在工作群組設定中選擇哪個選項來加密查詢結果,都會使用 SSE_S3 加密來編寫 Athena 查詢結果。此限制包括 Athena 將資料寫入 S3 Express 單區域儲存貯體的所有案例,包括 CREATE TABLE AS (CTAS) 和INSERT INTO陳述式。

  • 在 S3 Express 單區資料上建立表格時,不支援 AWS Glue 爬行者程式。

  • MSCK REPAIR TABLE 陳述式不受支援。解決方法是使用 ALTER TABLE ADD PARTITION

  • ALTER TABLE ADD PARTITIONALTER TABLE DROP PARTITION、和ALTER TABLE RENAME PARTITION不支援 S3 快速單區中的冰山表格。

  • 下列檔案和資料表格式不受支援或支援有限。如果未列出格式,但 Athena 支援格式 (例如實木地板和JSON),則也支援這些格式與 S3 Express 單區域儲存搭配使用。ORC

    檔案或資料表格式 限制
    Apache Avro 不支援
    CloudTrail 日誌 不支援
    Apache Hudi 不支援
    Amazon Ion 不支援
    Logstash 日誌 不支援
    阿帕奇 WebServer 日志 不支援
    Delta Lake DDL不支援。如需使用虛擬結構描述建立 Delta Lake 資料表的詳細資訊,請參閱 同步處理三角洲湖元。支援針對資料表進行的 SELECT 查詢。

開始使用

使用 Athena 查詢 S3 Express 單區域資料非常簡單。若要開始使用,請使用下列程序。

使用 Athena SQL 查詢 S3 快速單區域資料
  1. 將您的資料轉移到 S3 Express 單區域儲存。如需詳細資訊,請參閱《Amazon S3 使用者指南》中的設定物件的儲存類別

  2. 使用 Athena 中的 CREATE TABLE 陳述式來編目 AWS Glue Data Catalog中的資料。如需在 Athena 中建立資料表的詳細資訊,請參閱 在 Athena 建立表格CREATE TABLE 陳述式。

  3. (選用) 設定 Athena 工作群組的查詢結果位置,以使用 Amazon S3 目錄儲存貯體。Amazon S3 目錄儲存貯體的效能比一般儲存貯體更佳,並且專為需要延遲不到 10 毫秒持續效能的工作負載或效能關鍵型應用程式而設計。如需詳細資訊,請參閱《Amazon S3 使用者指南》中的目錄儲存貯體概觀