중요
이 섹션에서는 EC2 인스턴스에서 복구 메커니즘을 사전에 구성하는 방법을 설명합니다. 이러한 복구 메커니즘은 AWS가 시스템 상태 확인 실패를 유발하는 기본 하드웨어 또는 소프트웨어 결함을 감지할 때 인스턴스 가용성을 복원하도록 설계되었습니다. 현재 인스턴스에 액세스하는 데 문제가 있는 경우 EC2 인스턴스 문제 해결을 참조하세요.
AWS가 기본 하드웨어 또는 소프트웨어 문제로 인해 인스턴스가 사용할 수 없는 상태임을 감지하면 CloudWatch 작업 기반 복구는 기본 문제가 있는 호스트에서 다른 호스트로 인스턴스를 이동하여 인스턴스 가용성을 자동으로 복원할 수 있습니다.
CloudWatch 작업 기반 복구가 발생하는 경우 AWS는 결과에 따라 다음 이벤트 중 하나를 AWS Health Dashboard에 전송합니다.
-
성공 이벤트:
AWS_EC2_INSTANCE_AUTO_RECOVERY_SUCCESS
-
실패 이벤트:
AWS_EC2_INSTANCE_AUTO_RECOVERY_FAILURE
CloudWatch 작업 기반 복구를 구성하면 Amazon CloudWatch 경보에 복구 작업을 추가할 수 있습니다. CloudWatch 작업 기반 복구는 StatusCheckFailed_System
지표와 함께 작동합니다. CloudWatch 작업 기반 복구에서는 최첨단 복구 응답 시간 세분성과 복구 작업 및 결과에 대한 Amazon Simple Notification Service(Amazon SNS) 알림이 제공됩니다. 이러한 구성 옵션을 사용하면 간소화된 자동 복구에 비해 시스템 상태 검사 실패 이벤트 응답을 더 세밀하게 제어하여 복구 시도를 더 빠르게 수행할 수 있습니다. 사용 가능한 CloudWatch 옵션에 대한 자세한 내용은 인스턴스 상태 검사를 참조하세요.
그러나 CloudWatch 작업 기반 복구는 인스턴스가 running
상태이고 AWS Health Dashboard에 나열된 서비스 이벤트가 없으며 인스턴스 유형에 사용 가능한 용량이 있는 경우에만 작동합니다. 심각한 중단과 같은 일부 상황에서는 용량 제약으로 인해 복구 시도가 실패할 수 있습니다. 자세한 내용은 CloudWatch 작업 기반 복구 실패 문제 해결 단원을 참조하십시오.
주의
AWS가 기본 하드웨어 또는 소프트웨어 문제로 인해 인스턴스를 복구하는 경우 휘발성 메모리(RAM)와 인스턴스 저장소 볼륨에 저장된 데이터가 손실되고 운영 체제의 가동 시간이 0에서 다시 시작됩니다. 데이터 손실을 방지하려면 중요한 데이터의 백업을 정기적으로 생성하는 것이 좋습니다. EC2 인스턴스의 백업 및 복구 모범 사례에 대한 자세한 내용은 Amazon EC2 모범 사례를 참조하세요.
자동 인스턴스 복구 메커니즘은 개별 인스턴스에 맞게 설계되었습니다. 복원력이 높은 시스템 구축에 대한 지침은 복원력 있는 시스템 구축 섹션을 참조하세요.
CloudWatch 작업 기반 복구 활성화에 대한 요구 사항
CloudWatch 작업 기반 복구는 다음 기준을 충족하는 인스턴스에서 활성화할 수 있습니다.
- 인스턴스 타입
-
-
범용: A1, M3, M4, M5, M5a, M5n, M5zn, M6a, M6g, M6i, M6in, M7a, M7g, M7i, M7i-flex, M8g, T1, T2, T3, T3a, T4g
-
컴퓨팅 최적화: C3, C4, C5, C5a, C5n, C6a, C6g, C6gn, C6i, C6in, C7a, C7g, C7gn, C7i, C7i-flex, C8g
-
메모리 최적화: R3, R4, R5, R5a, R5b, R5n, R6a, R6g, R6i, R6in, R7a, R7g, R7i, R7iz, R8g, U-3tb1, U-6tb1, U-9tb1, U-12tb1, U-18tb1, U-24tb1, U7i-6tb, U7i-8tb, U7i-12tb, U7in-16tb, U7in-24tb, U7in-32tb, U7inh-32tb, X1, X1e, X2idn, X2iedn, X2iezn, X8g
-
가속 컴퓨팅: G3, G5g, Inf1, P2, P3, VT1
-
고성능 컴퓨팅: Hpc6a, Hpc7a, Hpc7g
-
메탈 인스턴스: 메탈 인스턴스 크기를 가진 위의 모든 인스턴스 유형
-
시작 시 인스턴스 저장소 볼륨이 추가되는 경우: M3, C3, R3, X1, X1e, X2idn, X2iedn 인스턴스 유형만 지원
-
- Tenancy
-
-
공유
-
Dedicated Instance
자세한 내용은 Amazon EC2 전용 인스턴스 단원을 참조하십시오.
-
제한 사항
CloudWatch 작업 기반 복구는 다음과 같은 특성이 있는 인스턴스에서는 지원되지 않습니다.
-
테넌시: 전용 호스트. 전용 호스트의 경우 전용 호스트 자동 복구를 대신 사용합니다.
-
네트워킹: Elastic Fabric Adapter를 사용하는 인스턴스
-
Auto Scaling: Auto Scaling 그룹에 포함된 인스턴스
-
유지 관리: 현재 예약된 유지 관리 이벤트가 진행 중인 인스턴스
CloudWatch 작업 기반 복구를 지원하는 인스턴스 유형 보기
AWS Management Console 또는 AWS CLI를 사용하여 복구를 기반으로 한 CloudWatch 작업을 지원하는 인스턴스 유형을 볼 수 있습니다.
CloudWatch 작업 기반 복구를 지원하는 인스턴스 유형을 보려면
-
https://console.aws.amazon.com/ec2/
에서 Amazon EC2 콘솔을 엽니다. -
왼쪽 탐색 창에서 인스턴스 유형(Instance Types)을 선택합니다.
-
필터 막대에 Auto Recovery support: true를 입력합니다. 문자를 입력할 때 필터 이름이 나타나면 해당 필터 이름을 선택할 수 있습니다.
인스턴스 유형 테이블에는 CloudWatch 작업 기반 복구를 지원하는 모든 인스턴스 유형이 표시됩니다.
CloudWatch 작업 기반 복구 구성
EC2 인스턴스에 대한 CloudWatch 작업 기반 복구를 구성하려면 지정된 인스턴스의 StatusCheckFailed_System
지표를 모니터링하는 CloudWatch 경보를 생성합니다. 지표 값이 1(시스템 상태 확인 실패)일 때 경보가 트리거되도록 설정합니다. 트리거될 때 인스턴스를 자동으로 복구하도록 경보 작업을 구성합니다.
Amazon EC2 콘솔 또는 CloudWatch 콘솔을 사용하여 경보를 구성할 수 있습니다. 지침은이 본 사용 설명서 Amazon CloudWatch 경보에 복구 작업 추가 섹션 또는 Amazon CloudWatch 사용 설명서의 Amazon CloudWatch 경보에 복구 작업 추가하기를 참조하세요.
CloudWatch 작업 기반 복구 실패 문제 해결
CloudWatch 작업 기반 복구가 인스턴스 복구에 실패할 경우 다음 사항을 고려하세요.
-
AWS 서비스 이벤트 실행 중
CloudWatch 작업 기반 복구는 AWS Health Dashboard에서 서비스 이벤트가 발생하는 동안에는 작동하지 않습니다. 이 이벤트에 대한 복구 실패 알림을 받지 못할 수도 있습니다. 최신 서비스 가용성 정보에 대해서는 서비스 상태
상태 페이지를 참조하세요. -
용량 부족
인스턴스를 마이그레이션할 대체 하드웨어가 일시적으로 부족합니다.
-
최대 일일 복구 시도 횟수 도달
인스턴스 복구 시도가 하루 최대 허용 횟수에 도달했습니다. 자동 복구가 실패하고 원래 시스템 상태 확인 실패의 근본 원인이 하드웨어 성능 저하로 확인되는 경우 이후에 인스턴스가 종료될 수 있습니다.
여러 번의 복구 시도에도 불구하고 인스턴스의 시스템 상태 검사 실패가 계속되는 경우 상태 검사에 실패한 인스턴스 문제 해결에서 추가 지침을 참조하세요.