復原您的執行個體 - Amazon Elastic Compute Cloud

本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。

復原您的執行個體

若要在發生系統狀態檢查失敗時自動復原執行個體,您可以使用執行個體的預設組態或建立 Amazon CloudWatch 警示。若執行個體因基礎硬體故障或需要 AWS 參與修復的問題而無法連結,則會自動復原該執行個體。

復原後的執行個體與原始執行個體相同,包括執行個體 ID、私有 IP 地址、彈性 IP 地址及所有執行個體中繼資料。如果受損的執行個體具有公有 IPv4 地址,執行個體將在復原後保留公有 IPv4 地址。如果受損的執行個體位於配置群組,已復原的執行個體便會在該配置群組中執行。在執行個體復原期間,執行個體會在重新啟動過程中遷移,且記憶體內的任何資料都將遺失。

需復原執行個體的問題舉例如下:

  • 網路連線中斷

  • 系統電力中斷

  • 實體主機的軟體問題

  • 實體主機上會影響網路連線的硬體問題

根據執行個體組態的簡化自動復原程序

支援簡化自動復原程序的執行個體的預設設定為復原發生故障的執行個體。預設組態適用於您啟動的新執行個體和您之前啟動的現有執行個體。簡化的自動復原程序會啟動以回應系統狀態檢查故障。在服務運作狀態儀表板事件或影響基礎硬體的任何其他事件期間,不會運行簡化的自動復原程序。如需詳細資訊,請參閱 針對執行個體復原失敗的問題,進行故障診斷

當簡化的自動復原事件成功時,您會透過 AWS Health 儀表板事件收到通知。當簡化的自動復原事件失敗時,您會透過 AWS Health 儀表板事件和電子郵件收到通知。您也可以使用 Amazon EventBridge 規則,使用下列事件代碼監控簡化的自動復原事件:

  • AWS_EC2_SIMPLIFIED_AUTO_RECOVERY_SUCCESS - 成功的事件

  • AWS_EC2_SIMPLIFIED_AUTO_RECOVERY_FAILURE - 失敗的事件

如需詳細資訊,請參閱 Amazon EventBridge 規則

要求

如果執行個體具有以下特性,則此執行個體支援簡化的自動復原程序:

  • 使用 defaultdedicated 執行個體租用。

  • 未使用 Elastic Fabric Adapter。

  • 使用下列其中一個執行個體類型:

    • 一般用途: M3 | M4 | M5 | M5a | M5n | M5zn | M6a | M6i | M6in | M7a | M7i | M7i-flex | T1 | T2 | T3 | T3a

    • 運算最佳化: C3 | C4 | C5 | C5a | C5n | C6a | C6i | C6in | C7a | C7i

    • 記憶體最佳化:R3 | R4 | R5 | R5A | R5b | R5 安 | 六 A | 六英寸 | 六英寸 | R7 安培 | R7I | 三倍 1 | U-九 TB1 | U-十八 TB1 |

    • 加速運算: G3 | G3s | P2 | P3

    • 高效能運算 Hpc7a

  • 無執行個體儲存體磁碟區。如果 Nitro 執行個體類型具有執行個體儲存體磁碟區,或者 Xen 型執行個體在所使用的 AMI 中具有映射的執行個體儲存體磁碟區,則該執行個體無法自動復原。

    重要

    如果執行個體已連接執行個體儲存體磁碟區,則停止和啟動執行個體將導致執行個體儲存體磁碟區上的所有資料遺失。應定期將執行個體儲存體磁碟區資料備份到更持久的儲存體,例如 Amazon EBS、Amazon S3 或 Amazon EFS。如果系統狀態檢查失敗,可以停止和啟動具有執行個體儲存體磁碟區的執行個體,然後使用備份資料還原執行個體儲存體磁碟區。

限制

  • 簡化的自動復原程序不支援具有執行個體存放區磁碟區和硬體的執行個體類型的執行個體。

  • Auto Scaling 群組中的執行個體不會啟動簡化的自動復原程序。如果您的執行個體屬於已啟用運作狀態檢查的 Auto Scaling 群組的一部分,則在為該執行個體受損時會將其取代。

  • 簡化的自動復原僅適用於意外事件。它不適用於排程事件。

  • 已終止或停止的執行個體無法復原。

設定復原行為

您可在啟動執行個體期間或之後將自動復原行為設定為 disableddefault。預設組態僅會針對支援的執行個體類型啟用簡化的自動復原程序。

Console
啟動執行個體時停用簡化的自動復原程序
  1. 前往 https://console.aws.amazon.com/ec2/ 開啟 Amazon EC2 主控台。

  2. 在導覽窗格中,選擇 Instances (執行個體),然後選擇 Launch Instance (啟動執行個體)

  3. Advanced details (進階詳細資訊) 區段,針對 Instance auto-recovery (執行個體自動復原),選取 Disabled (已停用)。

  4. 根據需要進行剩餘的執行個體啟動設定,然後啟動執行個體。

針對執作中或已停止的執行個體停用簡化的自動復原程序
  1. https://console.aws.amazon.com/ec2/ 開啟 Amazon EC2 主控台。

  2. 在導覽窗格中,選擇執行個體

  3. 選取執行個體,然後選取 Actions (動作)、Instance Settings (執行個體設定)、Change Shutdown Behavior (變更關機行為)。

  4. 選擇 Off (關閉),然後選擇 Save (儲存)。

針對執作中或已停用的執行個體將自動復原行為設定為 default
  1. https://console.aws.amazon.com/ec2/ 開啟 Amazon EC2 主控台。

  2. 在導覽窗格中,選擇執行個體

  3. 選取執行個體,然後選取 Actions (動作)、Instance Settings (執行個體設定)、Change Shutdown Behavior (變更關機行為)。

  4. 選擇預設,然後選擇儲存

AWS CLI
啟動時停用簡化的自動復原程序

使用 run-instances 命令。

aws ec2 run-instances \ --image-id ami-1a2b3c4d \ --instance-type t2.micro \ --key-name MyKeyPair \ --maintenance-options AutoRecovery=Disabled \ [...]
針對執作中或已停止的執行個體停用簡化的自動復原程序

使用 modify-instance-maintenance-options 命令。

aws ec2 modify-instance-maintenance-options \ --instance-id i-0abcdef1234567890 \ --auto-recovery disabled
針對執作中或已停用的執行個體將自動復原行為設定為 default

使用 modify-instance-maintenance-options 命令。

aws ec2 modify-instance-maintenance-options \ --instance-id i-0abcdef1234567890 \ --auto-recovery default

Amazon CloudWatch 動作型復原

如果您想要自訂何時復原執 CloudWatch 行個體,請使用 Amazon 動作型復原。

StatusCheckFailed_System 警示觸發且復原動作啟動時,您將會收到 Amazon SNS 主題通知,這是您在建立警示時選取並與復原動作關聯的通知。當復原動作完成時,會將資訊發佈到您為此警示設定的 Amazon SNS 主題。訂閱此 Amazon SNS 主題的所有使用者都會收到電子郵件通知,其中包含復原嘗試的狀態和進一步的說明。在復原動作的最後步驟中,復原的執行個體將重新啟動。

即使未停用簡化的自動復原,您也可以使用 Amazon CloudWatch 警示來復原執行個體。如需建立 Amazon CloudWatch 警示以復原執行個體的相關資訊,請參閱將恢復動作添加到 Amazon CloudWatch 警報

支援的執行個體類型

Amazon 動作型復原也支援簡化自動復原支援的所有執 CloudWatch 行個體類型。此外,基於 CloudWatch 動作的復原支援支援的執行個體類型的裸機變體。除了簡化自動復原所支援的執行個體系列之外,還支援下列執行個體系列:

  • 記憶體已優化:X2idn | X2iedn

重要

對於具有執行個體儲存體磁碟區的支援執行個體類型,這些磁碟區上的任何資料都會在復原期間遺失。停止和啟動執行個體也會導致執行個體儲存體磁碟區上的所有資料遺失。應定期將執行個體儲存體磁碟區資料備份到更持久的儲存體,例如 Amazon EBS、Amazon S3 或 Amazon EFS。如果系統狀態檢查失敗,可以停止和啟動具有執行個體儲存體磁碟區的執行個體,然後使用備份資料還原執行個體儲存體磁碟區。

CloudWatch 動作型復原不支援具有專用主機租用的執行個體復原。對於 Amazon EC2 專用執行個體,您可以使用專用執行個體自動復原來自動復原運作狀態不良的執行個體。

您可以使用 AWS Management Console 或 AWS CLI 來檢視支援 CloudWatch 動作型復原的執行個體類型。

Console
若要檢視支援 Amazon CloudWatch 動作型復原的執行個體類型
  1. 前往 https://console.aws.amazon.com/ec2/ 開啟 Amazon EC2 主控台。

  2. 在左側導覽窗格中選擇 Instance Types (執行個體類型)。

  3. 在篩選條件列中,輸入 Auto Recovery support: true (支援自動復原程序:是)。或者,當您輸入字元且篩選條件名稱顯示時,您可以選取它。

    執行個體類型」表格會顯示支援 Amazon CloudWatch 動作型復原的所有執行個體類型。

AWS CLI
若要檢視支援 Amazon CloudWatch 動作型復原的執行個體類型

使用 describe-instance-types 命令。

aws ec2 describe-instance-types --filters Name=auto-recovery-supported,Values=true --query "InstanceTypes[*].[InstanceType]" --output text | sort

針對執行個體復原失敗的問題,進行故障診斷

下列的問題可能會造成復原執行個體的作業失敗:

  • 在服務運作狀態儀表板事件期間,簡化的自動復原程序可能無法復原執行個體。您可能不會收到此類事件的復原故障通知。任何正在進行的 Service Health Dashboard 表板事件也可能會阻止以 CloudWatch 動作為基礎的復原成功復原 如需最新的服務可用性資訊,請參閱 http://status.aws.amazon.com/

  • 替換硬體的容量暫時不足。

  • 執行個體已達到每日三次復原嘗試的最高限額。

自動復原程序會嘗試復原執行個體,每日最多可失敗三次。如果執行個體系統狀態檢查持續未通過,我們建議您以手動方式,來停止並啟動執行個體。在執行個體停止時,執行個體儲存體磁碟區上的資料會遺失。如需詳細資訊,請參閱 停止並啟動 Amazon EC2 執行個體

如果自動復原失敗,而原始系統狀態檢查未通過的原因判定為硬體劣化,則執行個體可能隨後會遭到淘汰。