使用並行擴展 - Amazon Redshift

本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。

使用並行擴展

使用並行擴展功能,您可以藉由持續的快速查詢效能,支援幾乎無限的並行使用者和並行查詢。

當您啟用並行擴展時,Amazon Redshift 會自動新增額外的叢集容量,以執行增加的讀寫查詢。使用者會看到最新資料,無論查詢是執行於主要叢集或並行擴展叢集。您只會向您收取並行擴展叢集實際執行查詢時的費用。如需定價的詳細資訊,請參Amazon Redshift 定價

您可以通過設定 WLM 佇列來管理要將哪些查詢傳送至並行擴展叢集。當您啟用並行擴展時,合格查詢將傳送到並行擴展叢集,而非排隊等待。

並行擴展功能

當您打開 WLM 隊列的併發縮放時,它適用於讀取操作,如儀錶板查詢。它也適用於常用的寫入操作,例如用於數據提取和處理的語句。

寫入操作的併發擴展功能

並行擴展支援常用的寫入操作,如提取、轉換和載入 (ETL) 語句。當您希望在羣集收到大量請求時保持一致的響應時間時,寫操作的併發擴展特別有用。它提高了在主羣集上爭用資源的寫操作的吞吐量。

並行擴展支援 COPY、INSERE、DELETE 和 UPDATE 陳述式。在某些情況下,您可能會遵循 DDL 語句(如 CREATE),並在同一提交塊中使用寫入語句。在這些情況下,寫入語句不會發送到併發擴展羣集。

當您為併發擴展累積積分時,此積分應用於讀取和寫入操作。

並行擴展的限制

以下是使用 Amazon Redshift 併發擴展的限制:

  • 它不支援使用交錯排序索引鍵的資料表的查詢。

  • 它不支援臨時表的查詢。

  • 它不支持訪問受限制性網絡或虛擬私有雲 (VPC) 配置保護的外部資源的查詢。

  • 它不支援包含 Python 使用者定義函數 (UDF) 的查詢。

  • 它不支持訪問系統表、PostgreSQL 目錄表或無備份表的查詢。

  • 它不支持訪問具有限制性資源策略的外部資源的 COPY 或 UNLOAD 查詢。外部資源可以包括 Amazon S3 儲存桶或 DynamoDB 資料表。策略可以限制存取特定源 VPC (aws:sourceVpc)、源 VPC 終端節點(aws:sourceVpce)或源 IP 地址(aws:SourceIp。在某些情況下,您可能需要刪除外部資源上的策略。執行此操作意味着訪問資源的 COPY 或 UNLOAD 查詢將發送到並發擴展集羣。

  • DDL 操作(如創建表或 ALTER 表)不支持用於寫入操作的 Amazon Redshift 併發擴展。

  • 它不支援 COPY 命令的分析。

  • 它不支持對 DISTSTYLE 設置為「全部」的目標表執行寫入操作。

  • 它不支持來自 Amazon Redshift Spectrum 或亞馬遜 EMR 的拷貝。

  • 它不支持對具有標識列的表進行寫入操作。

  • Amazon Redshift 僅支持在 Amazon Redshift RA3 節點上執行寫入操作的併發擴展,特別是高達 3.16 倍大、RA3.4 倍大和 RA3.xlplus。其他節點類型不支持寫入操作的併發縮放。

如需有關並行擴展的詳細資訊,請參Amazon Redshift 叢集管理指南