本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。
使用 Capacity Blocks 適用於機器學習工作負載
Capacity Blocks 協助您在未來的日期保留熱門GPU執行個體,以支援您的短期機器學習 (ML) 工作負載。
如需 的概觀 Capacity Blocks 以及它們的運作方式,請參閱 Capacity Blocks 適用於 Amazon EC2使用者指南 中的 ML。
若要開始使用 Capacity Blocks,您可以在特定可用區域中建立容量保留。Capacity Blocks 會在單一可用區域中以targeted
容量保留形式交付。建立啟動範本時,請指定容量區塊的保留 ID 和執行個體類型。然後,更新您的 Auto Scaling 群組,以使用您建立的啟動範本和容量區塊的可用區域。當您的容量區塊保留開始時,請使用排程擴展來啟動與容量區塊保留相同的執行個體數目。
重要
Capacity Blocks 僅適用於特定 Amazon EC2執行個體類型和 AWS 區域。如需詳細資訊,請參閱 Amazon EC2使用者指南 中的先決條件。
操作準則
下列是透過 Auto Scaling 群組使用容量區塊時應遵循的基本操作準則。
-
在容量區塊保留結束時間前 30 分鐘以上,將您的 Auto Scaling 群組縮減為零。Amazon EC2將在容量區塊的結束時間之前 30 分鐘終止仍在執行的任何執行個體。
-
我們建議您使用排程擴展來縮減 (新增執行個體),並在適當的保留時間縮減 (移除執行個體)。如需詳細資訊,請參閱Amazon EC2 自動擴展的排程擴展。
-
視需要新增生命週期關聯,以便在縮減期間對執行個體內的應用程式執行正常關閉程序。在容量區塊保留結束時間前 30 分鐘,Amazon EC2開始強制終止執行個體之前,請預留足夠的時間完成生命週期動作。如需詳細資訊,請參閱Amazon EC2 Auto Scaling lifecycle hook。
-
請確定 Auto Scaling 群組在整個保留期間皆指向正確的啟動範本版本。我們建議您指向特定版本的啟動範本,而不是
$Default
或$Latest
版本。
注意
如果您在保留結束之前讓容量區塊執行個體持續執行,且 Amazon EC2將其復原,則 Auto Scaling 群組的擴展活動狀態為「taken out of service in response to an EC2 health check that indicated it had been terminated or stopped
」,即使它刻意在容量區塊結束時復原。同樣地,Amazon EC2 Auto Scaling 會嘗試以與未通過運作狀態檢查的任何執行個體相同的方式取代執行個體。如需詳細資訊,請參閱Auto Scaling 群組中的執行個體運作狀態檢查。
在啟動範本中指定容量區塊
若要建立以 Auto Scaling 群組的特定容量區塊為目標的啟動範本,請使用下列其中一種方法:
限制
-
支援 Capacity Blocks 只有在 Auto Scaling 群組具有相容的組態時,才能使用 。不支援混合執行個體群組和暖集區。
-
您一次只能鎖定一個容量區塊。
相關資源
-
如需使用 P5 執行個體的先決條件和建議,請參閱 Amazon EC2使用者指南 中的 P5 執行個體入門。
-
Amazon EKS支援使用 Capacity Blocks 以支援 Amazon EKS叢集上的短期機器學習 (ML) 工作負載。如需詳細資訊,請參閱 Capacity Blocks 適用於 Amazon EKS使用者指南 中的 ML。
-
您可以使用...Capacity Blocks 支援執行個體類型和區域。不過,隨需容量預留可提供彈性,以為其他執行個體類型和區域保留容量。如需示範如何使用隨需容量預留選項的教學課程,請參閱 使用容量保留在特定可用區域中保留容量 。