復原您的執行個體 - Amazon Elastic Compute Cloud

復原您的執行個體

若要在系統狀態檢查發生故障時自動復原執行個體,可使用執行個體的預設組態或建立 Amazon CloudWatch 警示。若執行個體因基礎硬體故障或需要 AWS 參與修復的問題而無法連結,則會自動復原該執行個體。

復原後的執行個體與原始執行個體相同,包括執行個體 ID、私有 IP 地址、彈性 IP 地址及所有執行個體中繼資料。如果受損的執行個體具有公有 IPv4 地址,執行個體將在復原後保留公有 IPv4 地址。如果受損的執行個體位於配置群組,已復原的執行個體便會在該配置群組中執行。在執行個體復原期間,執行個體會在重新啟動過程中遷移,且記憶體內的任何資料都將遺失。

需復原執行個體的問題舉例如下:

  • 網路連線中斷

  • 系統電力中斷

  • 實體主機的軟體問題

  • 實體主機上會影響網路連線的硬體問題

根據執行個體組態的簡化自動復原程序

支援簡化自動復原程序的執行個體的預設設定為復原發生故障的執行個體。預設組態適用於您啟動的新執行個體和您之前啟動的現有執行個體。簡化的自動復原程序會啟動以回應系統狀態檢查故障。在服務運作狀態儀表板事件或影響基礎硬體的任何其他事件期間,不會運行簡化的自動復原程序。如需詳細資訊,請參閱 針對執行個體復原失敗的問題,進行故障診斷

當簡化的自動復原事件成功時,您會透過 AWS Health 儀表板事件收到通知。當簡化的自動復原事件失敗時,您會透過 AWS Health 儀表板事件和電子郵件收到通知。您還可以使用 Amazon EventBridge 規則,利用以下事件代碼監控簡化的自動復原事件:

  • AWS_EC2_SIMPLIFIED_AUTO_RECOVERY_SUCCESS - 成功的事件

  • AWS_EC2_SIMPLIFIED_AUTO_RECOVERY_FAILURE - 失敗的事件

如需詳細資訊,請參閱 Amazon EventBridge 規則

要求

如果執行個體具有以下特性,則此執行個體支援簡化的自動復原程序:

  • 使用 defaultdedicated 執行個體租用。

  • 未使用 Elastic Fabric Adaptor。

  • 使用下列其中一個執行個體類型:

    • 一般用途:A1 | M4 | M5 | M5a | M5n | M5zn | M6a | M6g | M6i | T1 | T2 | T3 | T3a | T4g

    • 運算最佳化:C4 | C5 | C5a | C5n | C6a | C6g | C6gn | C6i | Hpc6a |

    • 記憶體最佳化:R4 | R5 | R5a | R5b | R5n | R6a | R6g | R6i | 記憶體密集型 (u-*),僅虛擬化

    • 加速運算:G3 | G5g | Inf1 | P2 | P3 | VT1

  • 如果沒有執行個體存放區,則使用下列執行個體類型之一:

    • 一般用途:M3

    • 運算優化:C3

    • 記憶體最佳化:R3 | X1 | X1e

限制

  • 簡化的自動復原程序不支援具有執行個體存放區磁碟區和硬體的執行個體類型的執行個體。

  • 如果您的執行個體屬於已啟用運作狀態檢查的 Auto Scaling 群組的一部分,則在為該執行個體受損時會將其取代。Auto Scaling 群組中的執行個體不會啟動自動復原。

  • 簡化的自動復原僅適用於意外事件。它不適用於排程事件。

  • 已終止或停止的執行個體無法復原。

驗證復原行為

可使用 AWS Management Console 或 AWS CLI 來檢視支援簡化自動復原程序的執行個體類型。

Console

檢視支援簡化自動復原程序的執行個體類型

  1. https://console.aws.amazon.com/ec2/ 開啟 Amazon EC2 主控台。

  2. 在左側導覽窗格中選擇 Instance Types (執行個體類型)。

  3. 在篩選條件列中,輸入 Auto Recovery support: true (支援自動復原程序:是)。或者,當您輸入字元且篩選條件名稱顯示時,您可以選取它。

    Instance types (執行個體類型) 表格會顯示支援簡化自動復原的所有執行個體類型。

AWS CLI

檢視支援簡化自動復原程序的執行個體類型

使用 describe-instance-types 命令。

aws ec2 describe-instance-types --filters Name=auto-recovery-supported,Values=true --query "InstanceTypes[*].[InstanceType]" --output text | sort

設定復原行為

您可在啟動執行個體期間或之後將自動復原行為設定為 disableddefault。預設組態僅會針對支援的執行個體類型啟用簡化的自動復原程序。

Console

啟動執行個體時停用簡化的自動復原程序

  1. https://console.aws.amazon.com/ec2/ 開啟 Amazon EC2 主控台。

  2. 在導覽窗格中,選擇 Instances (執行個體),然後選擇 Launch Instance (啟動執行個體)

  3. Advanced details (進階詳細資訊) 區段,針對 Instance auto-recovery (執行個體自動復原),選取 Disabled (已停用)。

  4. 根據需要進行剩餘的執行個體啟動設定,然後啟動執行個體。

針對執作中或已停止的執行個體停用簡化的自動復原程序

  1. https://console.aws.amazon.com/ec2/ 開啟 Amazon EC2 主控台。

  2. 在導覽窗格中,選擇 Instances (執行個體)。

  3. 選取執行個體,然後選擇 Actions (動作)、Instance Settings (執行個體設定)、Change Shutdown Behavior (變更關機行為)。

  4. 選擇 Off (關閉),然後選擇 Save (儲存)。

針對執作中或已停用的執行個體將自動復原行為設定為 default

  1. https://console.aws.amazon.com/ec2/ 開啟 Amazon EC2 主控台。

  2. 在導覽窗格中,選擇 Instances (執行個體)。

  3. 選取執行個體,然後選擇 Actions (動作)、Instance Settings (執行個體設定)、Change Shutdown Behavior (變更關機行為)。

  4. 選擇 Default (預設),然後選擇 Save (儲存)。

AWS CLI

啟動時停用簡化的自動復原程序

使用 run-instances 命令。

aws ec2 run-instances \ --image-id ami-1a2b3c4d \ --instance-type t2.micro \ --key-name MyKeyPair \ --maintenance-options AutoRecovery=Disabled \ [...]

針對執作中或已停止的執行個體停用簡化的自動復原程序

使用 modify-instance-maintenance-options 命令。

aws ec2 modify-instance-maintenance-options \ --instance-id i-0abcdef1234567890 \ --auto-recovery disabled

針對執作中或已停用的執行個體將自動復原行為設定為 default

使用 modify-instance-maintenance-options 命令。

aws ec2 modify-instance-maintenance-options \ --instance-id i-0abcdef1234567890 \ --auto-recovery default

基於 Amazon CloudWatch 動作的復原程序

如果您希望自訂復原執行個體的時間,請使用基於 Amazon CloudWatch 動作的復原程序。

StatusCheckFailed_System 警示觸發且復原動作啟動時,您將會收到 Amazon SNS 主題通知,這是您在建立警示時選取並與復原動作關聯的通知。當復原動作完成時,會將資訊發佈到您為此警示設定的 Amazon SNS 主題。訂閱此 Amazon SNS 主題的所有使用者都會收到電子郵件通知,其中包含復原嘗試的狀態和進一步的說明。在復原動作的最後步驟中,復原的執行個體將重新啟動。

基於 CloudWatch 動作的復原程序也支援簡化的自動復原程序所支援的所有執行個體類型。如需詳細資訊,請參閱 要求。基於 Amazon CloudWatch 動作的復原不支援具有執行個體存放區磁碟區的執行個體,但以下執行個體類型除外。如果執行個體已連接執行個體存放區磁碟區,則資料在復原過程中會遺失。

  • 一般用途:M3

  • 運算優化:C3

  • 記憶體最佳化:R3 | X1 | X1e | X2idn | X2iedn

基於 Amazon CloudWatch 動作的復原程序不支援對具有 Amazon EC2 專用執行個體租用的執行個體和裸機執行個體進行復原。

即使沒有停用簡化的自動復原,您也可以使用 Amazon CloudWatch 警示來復原執行個體。如需建立 Amazon CloudWatch 警示以復原執行個體的相關資訊,請參閱將復原動作新增至 Amazon CloudWatch 警示

針對執行個體復原失敗的問題,進行故障診斷

下列的問題可能會造成復原執行個體的作業失敗:

  • 服務運作狀態儀表板事件或影響基礎機架的事件。在此類事件期間,簡化的自動復原程序不會復原執行個體。您將不會收到此類事件的復原故障通知。任何正在進行的服務運作狀態儀表板事件也可能會阻礙基於 Amazon CloudWatch 動作的復原程序成功復原執行個體。請參閱 http://status.aws.amazon.com/ 以取得最新的服務可用性資訊。

  • 替換硬體的容量暫時不足。

  • 執行個體具有已連結的執行個體存放區儲存體,這是未支援的執行個體自動復原組態。

  • 執行個體已達到每日三次復原嘗試的最高限額。

自動復原程序會嘗試復原執行個體,每日最多可失敗三次。如果執行個體系統狀態檢查持續未通過,我們建議您以手動方式,來停止並啟動執行個體。如需詳細資訊,請參閱 停止和啟動執行個體

如果自動復原失敗,而原始系統狀態檢查未通過的原因判定為硬體劣化,則執行個體可能隨後會遭到淘汰。