選取和部署 Amazon EMR 叢集

識別和組織節點類型。當您定義 Amazon EMR 叢集時，請務必了解其硬體。其運作方式？如何撰寫？這些問題的答案包括三個部分：

最初，主要節點負責管理一般資源。它會執行分散式應用程式的主要元件。例如，它會執行 Hadoop 分散式檔案系統 (HDFS) NameNode 服務、追蹤要在叢集上完成的任務，以及監控系統的運作狀態。

此外，Amazon EMR 具有核心節點和任務節點。核心節點由主節點管理。核心節點會執行任務節點，並負責將資料儲存在叢集的 HDFS 中。任務節點負責管理叢集的任務。任務節點不會儲存資料。（任務節點不是強制性的。)

當您設定和部署 Amazon EMR 叢集時，重要的考量是 EC2 執行個體的正確選擇，其將代表您的叢集節點。有數種方式可將 EC2 執行個體新增至叢集，取決於您使用的是叢集的執行個體群組組態或執行個體機群組態。如需支援執行個體類型的詳細資訊，請參閱 AWS 文件。

下列準則適用於大多數 Amazon EMR 叢集。您也可以檢閱叢集組態最佳實務。

執行個體選取準則

一般而言，Amazon EMR 實作偏好使用哪些執行個體，取決於您執行的任務。請考慮下列問題：

這些問題將協助您了解所需的執行個體類型，以及所需的實際特性。決定您要同時處理的任務數量，以及您需要多快處理任務。這很重要，因為 Amazon EMR 用量是以每小時遞增計費。當您開啟叢集時，需支付整小時的費用。

您可以檢查在不同 AWS 區域中執行的每個執行個體的成本。若要比較區域之間的價格，您可以使用AWS 定價計算器，並根據位置變更值。

當您已回答上述問題時，就可以根據這些要求選取執行個體。在您了解處理任務的需求之後，請根據您需要的特性來判斷執行個體類型：

了解執行個體類型及其功能的另一種方法是分析每個執行個體類型的預設記憶體。此指標可協助您調校和改善 MapReduce 任務的效能。如需詳細資訊，請參閱 Hadoop 協助程式組態設定。

當您知道所需的執行個體類型時，您可以規劃叢集容量。

您的瀏覽器已停用或無法使用 Javascript。

您必須啟用 Javascript，才能使用 AWS 文件。請參閱您的瀏覽器說明頁以取得說明。

叢集組態

預估容量