Amazon Redshift 資料倉儲的架構元件

我們建議您對 Amazon Redshift 資料倉儲中的核心架構元件有基本的了解。這些知識可協助您更了解如何設計查詢和資料表，以獲得最佳效能。

Amazon Redshift 中的資料倉儲包含下列核心架構元件：

叢集 – 叢集由一或多個運算節點組成，是 Amazon Redshift 資料倉儲的核心基礎設施元件。運算節點對外部應用程式是透明的，但您的用戶端應用程式只會直接與領導節點互動。典型叢集有兩個或多個運算節點。運算節點會透過領導節點進行協調。
領導節點 – 領導節點會管理用戶端程式和所有運算節點的通訊。領導者節點也會準備每當查詢提交至叢集時執行查詢的計劃。計劃準備就緒後，領導節點會編譯程式碼，將編譯的程式碼分發給運算節點，然後將資料配量指派給每個運算節點來處理查詢結果。
運算節點 – 運算節點會執行查詢。領導節點會編譯計畫中個別元素的程式碼，以執行查詢並將程式碼指派給個別運算節點。運算節點會執行編譯過的程式碼，並將中間的結果傳回領導節點，以進行最終的彙總。每個運算節點都有自己的專用 CPU、記憶體和連接的磁碟儲存。隨著工作負載的增長，您可以藉由增加節點的數量、將節點的類型升級，或是同時實行這兩種做法，來增加叢集的運算容量和儲存容量。
節點配量 – 運算節點會分割為稱為配量的單位。運算節點中的每個配量都會配置一部分的節點記憶體和磁碟空間，用於處理指派給節點的部分工作負載。這些分割接著會平行運作，以完成操作。資料會根據特定資料表的分佈樣式和分佈索引鍵，在配量之間分佈。資料的均勻分佈可讓 Amazon Redshift 將工作負載平均指派至配量，並最大化平行處理的優勢。每個運算節點的配量數量取決於節點的類型。如需詳細資訊，請參閱《Amazon Redshift 文件》中的 Amazon Redshift 中的叢集和節點。
大規模平行處理 (MPP) – Amazon Redshift 使用 MPP 架構快速處理資料，甚至是複雜的查詢和大量的資料。多個運算節點會在部分資料上執行相同的查詢程式碼，以最大化平行處理。
用戶端應用程式 – Amazon Redshift 與各種擷取、轉換和載入 (ETL)、商業智慧 (BI) 報告、資料探勘和分析工具整合。所有用戶端應用程式只能透過領導節點與叢集通訊。

下圖顯示 Amazon Redshift 資料倉儲的架構元件如何協同運作以加速查詢。

Amazon Redshift 叢集中的領導節點和運算節點，處理來自用戶端的查詢。

您的瀏覽器已停用或無法使用 Javascript。

您必須啟用 Javascript，才能使用 AWS 文件。請參閱您的瀏覽器說明頁以取得說明。

文件慣用形式

簡介

查詢處理