REL07-BP02 在偵測到工作負載受損時取得資源 - 可靠性支柱

REL07-BP02 在偵測到工作負載受損時取得資源

在可用性受到影響時視需要主動擴展資源,以還原工作負載可用性。

您必須先設定運作狀態檢查和這些檢查的條件,以指出可用性因資源不足而受到影響的時間。然後,通知適當的人員手動擴展資源,或啟動自動化以自動調整資源規模。

您可以針對工作負載手動調整規模 (例如,變更 Auto Scaling 群組中的 EC2 執行個體數量,或透過 AWS Management Console 或 AWS CLI 修改 DynamoDB 資料表的輸送量)。但是,應該盡可能使用自動化 (請參閱取得或擴展資源時使用自動化)。

預期成果:在偵測到故障或客戶體驗降級時,會啟動擴展活動 (自動或手動),以恢復可用性。

未建立此最佳實務時的風險暴露等級:

實作指引

在工作負載中的所有元件實作可觀測性和監控,以監控客戶體驗並偵測故障。定義會擴展所需資源的手動或自動程序。如需詳細資訊,請參閱 REL11-BP01 監控工作負載的所有元件以偵測故障

實作步驟

  • 定義會擴展所需資源的手動或自動程序。

    • 擴展程序取決於工作負載內不同元件的設計方式。

    • 擴展程序也會根據所使用的基礎技術而有所不同。

      • 使用 AWS Auto Scaling 的元件可以使用擴展計劃來設定用於擴展資源的一組指示。如果您使用 AWS CloudFormation 或將標籤新增至 AWS 資源,則可以針對每個應用程式的不同資源集設定擴展計畫。Auto Scaling 為針對每個資源自訂擴展的策略提供建議。建立擴展計畫之後,Auto Scaling 會將動態擴展和預測擴展方法結合在一起,以支援您的擴展策略。如需詳細資訊,請參閱擴展計畫的運作方式

      • Amazon EC2 Auto Scaling 可確認您擁有正確數量的 Amazon EC2 執行個體可處理應用程式的負載。您可以建立稱為 Auto Scaling 群組的 EC2 執行個體集合。您可以在每個 Auto Scaling 群組中指定執行個體的最小和最大數量,而 Amazon EC2 Auto Scaling 可確保您的群組大小永遠不會低於或高於這些限制。如需詳細資訊,請參閱什麼是 Amazon EC2 Auto Scaling?

      • Amazon DynamoDB 自動擴展使用 Application Auto Scaling 服務代替您動態調整佈建的輸送容量,以回應實際的流量模式。這可讓資料表或全域次要索引增加其佈建的讀取與寫入容量,以在不需限流的情況下處理突然增加的流量。如需詳細資訊,請參閱使用 DynamoDB 自動擴展自動管理輸送容量

資源

相關的最佳實務:

相關文件: