本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。
了解 EMR Serverless 中的應用程式行為
本節說明任務提交行為、擴展的容量組態,以及 EMR Serverless 的工作者組態設定。
預設應用程式行為
自動啟動 — 根據預設,應用程式設定為在提交任務時自動啟動。您可以關閉此功能。
自動停止 — 根據預設,應用程式會設定為在閒置 15 分鐘時自動停止。當應用程式變更為 STOPPED
狀態時,它會釋出任何設定的預先初始化容量。您可以修改應用程式自動停止之前的閒置時間,也可以關閉此功能。
容量上限
您可以設定應用程式可擴展的最大容量。您可以指定 CPU、記憶體 (GB) 和磁碟 (GB) 的最大容量。
注意
我們建議您將最大容量設定為與支援的工作者大小成比例,方法是將工作者數量乘以其大小。例如,如果您想要將應用程式限制為 50 個工作者使用 2vCPUs、記憶體 16 GB 和磁碟 20 GB,請將最大容量設定為 100vCPUs、記憶體 800 GB 和磁碟 1000 GB。
支援的工作者組態
下表顯示您可以為 EMR Serverless 指定的支援工作者組態和大小。您可以根據工作負載的需求,為驅動程式和執行器設定不同的大小。
CPU | 記憶體 | 預設暫時性儲存 |
---|---|---|
1 vCPU |
最小 2 GB,最大 8 GB,以 1 GB 為增量單位 |
20 GB - 200 GB |
2 vCPU |
最小 4 GB,最大 16 GB,以 1 GB 遞增 |
20 GB - 200 GB |
4 vCPU |
最小 8 GB,最大 30 GB,以 1 GB 為增量單位 |
20 GB - 200 GB |
8 vCPU |
最小 16 GB,最大 60 GB,以 4 GB 為單位遞增 |
20 GB - 200 GB |
16 vCPU |
最小 32 GB,最大 120 GB,以 8 GB 為增量單位 |
20 GB - 200 GB |
CPU — 每個工作者可以有 1、2、4、8 或 16 個vCPUs。
記憶體 — 每個工作者都有記憶體,以 GB 為單位,在先前資料表中列出的限制內。Spark 任務具有記憶體額外負荷,表示其使用的記憶體超過指定的容器大小。此額外負荷是使用 屬性 spark.driver.memoryOverhead
和 來指定spark.executor.memoryOverhead
。額外負荷的預設值為容器記憶體的 10%,下限為 384 MB。當您選擇工作者大小時,應考慮此額外負荷。
例如,如果您為工作者執行個體選擇 4vCPUs,且預先初始化的儲存容量為 30 GB,則您應該為 Spark 任務將大約 27 GB 的值設定為執行器記憶體。這可將預先初始化容量的使用率最大化。可用的記憶體為 27 GB,加上 27 GB (2.7 GB) 的 10%,總共 29.7 GB。
磁碟 — 您可以使用大小下限為 20 GB 且上限為 200 GB 的暫存儲存磁碟來設定每個工作者。您只需為超過每個工作者所設定 20 GB 的額外儲存空間付費。