復原您的執行個體
若要在系統狀態檢查發生故障時自動復原執行個體,可使用執行個體的預設組態或建立 Amazon CloudWatch 警示。若執行個體因基礎硬體故障或需要 AWS 參與修復的問題而無法連結,則會自動復原該執行個體。
復原後的執行個體與原始執行個體相同,包括執行個體 ID、私有 IP 地址、彈性 IP 地址及所有執行個體中繼資料。如果受損的執行個體具有公有 IPv4 地址,執行個體將在復原後保留公有 IPv4 地址。如果受損的執行個體位於配置群組,已復原的執行個體便會在該配置群組中執行。在執行個體復原期間,執行個體會在重新啟動過程中遷移,且記憶體內的任何資料都將遺失。
需復原執行個體的問題舉例如下:
-
網路連線中斷
-
系統電力中斷
-
實體主機的軟體問題
-
實體主機上會影響網路連線的硬體問題
根據執行個體組態的簡化自動復原程序
支援簡化自動復原程序的執行個體的預設設定為復原發生故障的執行個體。預設組態適用於您啟動的新執行個體和您之前啟動的現有執行個體。簡化的自動復原程序會啟動以回應系統狀態檢查故障。在服務運作狀態儀表板事件或影響基礎硬體的任何其他事件期間,不會運行簡化的自動復原程序。如需詳細資訊,請參閱 針對執行個體復原失敗的問題,進行故障診斷。
當簡化的自動復原事件成功時,您會透過 AWS Health 儀表板事件收到通知。當簡化的自動復原事件失敗時,您會透過 AWS Health 儀表板事件和電子郵件收到通知。您還可以使用 Amazon EventBridge 規則,利用以下事件代碼監控簡化的自動復原事件:
-
AWS_EC2_SIMPLIFIED_AUTO_RECOVERY_SUCCESS
- 成功的事件 -
AWS_EC2_SIMPLIFIED_AUTO_RECOVERY_FAILURE
- 失敗的事件
如需詳細資訊,請參閱 Amazon EventBridge 規則。
需求
如果執行個體具有以下特性,則此執行個體支援簡化的自動復原程序:
-
使用
default
或dedicated
執行個體租用。 -
未使用 Elastic Fabric Adapter。
-
使用下列其中一個執行個體類型:
-
一般用途: A1 | M3 | M4 | M5 | M5a | M5n | M5zn | M6a | M6g | M6i | M6in | M7a | M7g | M7i | M7i-flex | T1 | T2 | T3 | T3a | T4g
-
運算最佳化: C3 | C4 | C5 | C5a | C5n | C6a | C6g | C6gn | C6i | C6in | C7a | C7g | C7gn | C7i | Hpc6a | Hpc7a | Hpc7g
-
記憶體優化: R3 | R4 | R5 | R5a | R5b | R5n | R6a | R6g | R6i | R6in | R7a | R7g | R7i | R7iz | u-3tb1 | u-6tb1 | u-9tb1 | u-12tb1 | u-18tb1 | u-24tb1 | X1 | X1e | X2iezn
-
加速運算: G3 | G3s | G5g | Inf1 | P2 | P3 | VT1
-
-
無執行個體儲存體磁碟區。如果 Nitro 執行個體類型具有執行個體儲存體磁碟區,或者 Xen 型執行個體具有映射的執行個體儲存體磁碟區,則不會自動復原執行個體。應定期將執行個體儲存體磁碟區資料備份到更持久的儲存體,例如 Amazon EBS、Amazon S3 或 Amazon EFS。如果系統狀態檢查失敗,可以停止和啟動具有執行個體儲存體磁碟區的執行個體,然後使用備份資料還原執行個體儲存體磁碟區。
限制
-
簡化的自動復原程序不支援具有執行個體存放區磁碟區和硬體的執行個體類型的執行個體。
-
Auto Scaling 群組中的執行個體不會啟動簡化的自動復原程序。如果您的執行個體屬於已啟用運作狀態檢查的 Auto Scaling 群組的一部分,則在為該執行個體受損時會將其取代。
-
簡化的自動復原僅適用於意外事件。它不適用於排程事件。
-
已終止或停止的執行個體無法復原。
設定復原行為
您可在啟動執行個體期間或之後將自動復原行為設定為 disabled
或 default
。預設組態僅會針對支援的執行個體類型啟用簡化的自動復原程序。
基於 Amazon CloudWatch 動作的復原程序
如果您希望自訂復原執行個體的時間,請使用基於 Amazon CloudWatch 動作的復原程序。
當 StatusCheckFailed_System
警示觸發且復原動作啟動時,您將會收到 Amazon SNS 主題通知,這是您在建立警示時選取並與復原動作關聯的通知。當復原動作完成時,會將資訊發佈到您為此警示設定的 Amazon SNS 主題。訂閱此 Amazon SNS 主題的所有使用者都會收到電子郵件通知,其中包含復原嘗試的狀態和進一步的說明。在復原動作的最後步驟中,復原的執行個體將重新啟動。
即使沒有停用簡化的自動復原,您也可以使用 Amazon CloudWatch 警示來復原執行個體。如需建立 Amazon CloudWatch 警示以復原執行個體的相關資訊,請參閱將復原動作新增至 Amazon CloudWatch 警示。
支援的執行個體類型
基於 CloudWatch 動作的復原程序也支援簡化的自動復原程序所支援的所有執行個體類型。此外,基於 Amazon CloudWatch 動作的復原支援具有執行個體儲存體磁碟區的以下執行個體類型。
-
一般用途:M3
-
運算最佳化:C3
-
記憶體最佳化: R3 | X1 | X1e | X2idn | X2iedn
重要
如果執行個體已連接執行個體存放區磁碟區,則資料在復原過程中會遺失。
基於 Amazon CloudWatch 動作的復原程序不支援對具有 Amazon EC2 專用執行個體租用的執行個體和裸機執行個體進行復原。
您可以使用 AWS Management Console 或 AWS CLI 檢視支援 Amazon CloudWatch 動作型復原的執行個體類型。
針對執行個體復原失敗的問題,進行故障診斷
下列的問題可能會造成復原執行個體的作業失敗:
-
在服務運作狀態儀表板事件期間,簡化的自動復原程序可能無法復原執行個體。您可能不會收到此類事件的復原故障通知。任何正在進行的服務運作狀態儀表板事件也可能會阻礙基於 CloudWatch 動作的復原程序成功復原執行個體。如需最新的服務可用性資訊,請參閱 http://status.aws.amazon.com/
。 -
替換硬體的容量暫時不足。
-
執行個體已達到每日三次復原嘗試的最高限額。
自動復原程序會嘗試復原執行個體,每日最多可失敗三次。如果執行個體系統狀態檢查持續未通過,我們建議您以手動方式,來停止並啟動執行個體。在執行個體停止時,執行個體儲存體磁碟區上的資料會遺失。如需詳細資訊,請參閱 停止和啟動執行個體。
如果自動復原失敗,而原始系統狀態檢查未通過的原因判定為硬體劣化,則執行個體可能隨後會遭到淘汰。