인스턴스 복구 - Amazon Elastic Compute Cloud

인스턴스 복구

시스템 상태 확인 실패 시 인스턴스를 자동으로 복구하려면 인스턴스의 기본 구성을 사용하거나 Amazon CloudWatch 경보를 생성할 수 있습니다. 기본 하드웨어 장애나 복구에 AWS 개입이 필요한 문제로 인해 인스턴스에 연결할 수 없는 경우 해당 인스턴스를 자동으로 복구할 수 있습니다.

복구된 인스턴스는 인스턴스 ID, 프라이빗 IP 주소, 탄력적 IP 주소 및 모든 인스턴스 메타데이터를 포함하여 원본 인스턴스와 동일합니다. 손상된 인스턴스에 퍼블릭 IPv4 주소가 있는 경우 복구 후에도 인스턴스에서 해당 퍼블릭 IPv4 주소를 유지합니다. 손상된 인스턴스가 배치 그룹에 있다면, 복구된 인스턴스는 배치 그룹에서 실행됩니다. 인스턴스 복구 중에 인스턴스를 재부팅할 때 인스턴스가 마이그레이션되고 메모리의 모든 데이터가 손실됩니다.

인스턴스 복구가 필요한 문제의 예는 다음과 같습니다.

  • 네트워크 연결 끊김

  • 시스템 전원 중단

  • 물리적 호스트의 소프트웨어 문제

  • 네트워크 연결성에 영향을 주는 물리적 호스트의 하드웨어 문제

인스턴스 구성에 따라 간소화된 자동 복구

간소화된 자동 복구를 지원하는 인스턴스는 기본적으로 실패한 인스턴스를 복구하도록 구성됩니다. 기본 구성은 사용자가 시작한 새 인스턴스와 이전에 시작한 기존 인스턴스에 적용됩니다. 시스템 상태 확인 실패에 대한 응답으로 간소화된 자동 복구가 시작됩니다. Service Health Dashboard 이벤트 또는 기본 하드웨어에 영향을 주는 기타 이벤트 중에는 간소화된 자동 복구가 수행되지 않습니다. 자세한 정보는 인스턴스 복구 실패 문제 해결을 참조하십시오.

간소화된 자동 복구 이벤트가 성공하면 AWS Health 대시보드 이벤트로 알려줍니다. 간소화된 자동 복구 이벤트가 실패하면 AWS Health 대시보드 이벤트나 이메일로 알려줍니다. 또한 Amazon EventBridge 규칙으로 다음 이벤트 코드를 사용하여 간소화된 자동 복구 이벤트를 모니터링할 수 있습니다.

  • AWS_EC2_SIMPLIFIED_AUTO_RECOVERY_SUCCESS - 성공한 이벤트

  • AWS_EC2_SIMPLIFIED_AUTO_RECOVERY_FAILURE - 실패한 이벤트

자세한 내용은 Amazon EventBridge 규칙을 참조하세요.

요구 사항

인스턴스에 다음과 같은 특성이 있는 경우 인스턴스에서 간소화된 자동 복구가 지원됩니다.

  • default 또는 dedicated 인스턴스 테넌시를 사용합니다.

  • Elastic Fabric Adaptor를 사용하지 않습니다.

  • 다음 인스턴스 유형 중 하나를 사용합니다.

    • 범용: A1 | M4 | M5 | M5a | M5n | M5zn | M6a | M6g | M6i | T1 | T2 | T3 | T3a | T4g

    • 컴퓨팅 최적화: C4 | C5 | C5a | C5n | C6a | C6g | C6gn | C6i | Hpc6a | C7g

    • 메모리 최적화: R4 | R5 | R5a | R5b | R5n | R6a | R6g | R6i | 고용량 메모리(u-*), 가상화 전용

    • 액셀러레이티드 컴퓨팅: G3 | G5g | Inf1 | P2 | P3 | VT1

  • 인스턴스 스토어 볼륨이 없는 경우 다음 인스턴스 유형 중 하나를 사용합니다.

    • 범용: M3

    • 컴퓨팅 최적화: C3

    • 메모리 최적화: R3 | X1 | X1e

제한 사항

  • 인스턴스 스토어 볼륨 및 메탈 인스턴스 유형이 있는 인스턴스는 간소화된 자동 복구가 지원되지 않습니다.

  • 인스턴스가 상태 확인이 활성화된 Auto Scaling 그룹의 일부인 경우에는 인스턴스가 손상되면 해당 인스턴스가 교체됩니다. 오토 스케일링 내부의 인스턴스에 대한 자동 복구는 시작되지 않습니다.

  • 간소화된 자동 복구는 계획되지 않은 이벤트에만 적용됩니다. 예약된 이벤트에는 적용되지 않습니다.

  • 종료하거나 중지한 인스턴스는 복구할 수 없습니다.

복구 동작 확인

간소화된 자동 복구가 지원되는 인스턴스 유형을 보려면 AWS Management Console 또는 AWS CLI를 사용할 수 있습니다.

Console

간소화된 자동 복구가 지원되는 인스턴스 유형을 보려면

  1. https://console.aws.amazon.com/ec2/에서 Amazon EC2 콘솔을 엽니다.

  2. 왼쪽 탐색 창에서 인스턴스 유형(Instance Types)을 선택합니다.

  3. 필터 막대에 Auto Recovery support: true를 입력합니다. 문자를 입력할 때 필터 이름이 나타나면 해당 필터 이름을 선택할 수도 있습니다.

    간소화된 자동 복구가 지원되는 모든 인스턴스 유형이 인스턴스 유형(Instance types) 테이블에 표시됩니다.

AWS CLI

간소화된 자동 복구가 지원되는 인스턴스 유형을 보려면

describe-instance-types 명령을 사용합니다.

aws ec2 describe-instance-types --filters Name=auto-recovery-supported,Values=true --query "InstanceTypes[*].[InstanceType]" --output text | sort

복구 동작 설정

인스턴스 시작 중 또는 이후 자동 복구 동작을 disabled 또는 default로 설정할 수 있습니다. 기본 구성에서는 지원되지 않는 인스턴스 유형에 대해 간소화된 자동 복구를 사용 설정하지 않습니다.

Console

인스턴스 시작 중 간소화된 자동 복구 비활성화

  1. https://console.aws.amazon.com/ec2/에서 Amazon EC2 콘솔을 엽니다.

  2. 탐색 창에서 인스턴스(Instances)를 선택한 후 인스턴스 시작(Launch instance)을 선택합니다.

  3. 고급 세부 정보(Advanced details) 섹션에서 인스턴스 자동 복구(Instance auto-recovery)에 대해 비활성화됨(Disabled)을 선택합니다.

  4. 필요에 따라 나머지 인스턴스 시작 설정을 구성한 다음 인스턴스를 시작합니다.

실행 중이거나 중지된 인스턴스에 대한 간소화된 자동 복구 사용 중지

  1. https://console.aws.amazon.com/ec2/에서 Amazon EC2 콘솔을 엽니다.

  2. 탐색 창에서 인스턴스(Instances)를 선택합니다.

  3. 인스턴스를 선택한 다음에 작업(Actions), 인스턴스 설정(Instance settings), 자동 복구 동작 변경(Change auto-recovery behavior)을 선택합니다.

  4. 해제(Off)를 선택한 다음 저장(Save)을 선택합니다.

실행 중이거나 중지된 인스턴스에 대한 자동 복구 동작을 default로 설정하려면

  1. https://console.aws.amazon.com/ec2/에서 Amazon EC2 콘솔을 엽니다.

  2. 탐색 창에서 인스턴스(Instances)를 선택합니다.

  3. 인스턴스를 선택한 다음에 작업(Actions), 인스턴스 설정(Instance settings), 자동 복구 동작 변경(Change auto-recovery behavior)을 선택합니다.

  4. 기본값(Default)을 선택한 다음 저장(Save)을 선택합니다.

AWS CLI

시작 시 간소화된 자동 복구 사용 중지

run-instances 명령을 사용합니다.

aws ec2 run-instances \ --image-id ami-1a2b3c4d \ --instance-type t2.micro \ --key-name MyKeyPair \ --maintenance-options AutoRecovery=Disabled \ [...]

실행 중이거나 중지된 인스턴스에 대한 간소화된 자동 복구 사용 중지

modify-instance-maintenance-options 명령을 사용합니다.

aws ec2 modify-instance-maintenance-options \ --instance-id i-0abcdef1234567890 \ --auto-recovery disabled

실행 중이거나 중지된 인스턴스에 대한 자동 복구 동작을 default로 설정하려면

modify-instance-maintenance-options 명령을 사용합니다.

aws ec2 modify-instance-maintenance-options \ --instance-id i-0abcdef1234567890 \ --auto-recovery default

Amazon CloudWatch 작업 기반 복구

인스턴스를 복구할 시기를 사용자 지정하려면 Amazon CloudWatch 작업 기반 복구를 사용합니다.

StatusCheckFailed_System 경보가 트리거되고 복구 작업이 시작되는 경우, 경보를 생성하고 복구 작업을 연결할 때 선택한 Amazon SNS 주제로 알림을 받습니다. 복구 작업이 완료되면 해당 경보를 위해 구성해 둔 Amazon SNS 주제로 정보가 게시됩니다. 이 Amazon SNS 주제에 가입되어 있는 사람은 누구나 복구 시도 상태와 세부 지침이 포함된 이메일 알림을 받게 됩니다. 복구 작업의 마지막 단계로 복구된 인스턴스가 재부팅됩니다.

간소화된 자동 복구로 지원되는 모든 인스턴스 유형은 CloudWatch 작업 기반 복구에서도 지원됩니다. 자세한 정보는 요구 사항을 참조하십시오. Amazon CloudWatch 작업 기반 복구는 다음 인스턴스 유형을 제외하고 인스턴스 스토어 볼륨이 있는 인스턴스를 지원하지 않습니다. 인스턴스에 인스턴스 스토어 볼륨이 연결되어 있으면 복구 중에 데이터가 손실됩니다.

  • 범용: M3

  • 컴퓨팅 최적화: C3

  • 메모리 최적화: R3 | X1 | X1e | X2idn | X2iedn

Amazon CloudWatch 작업 기반 복구에서는 Amazon EC2 전용 호스트 테넌시와 메탈 인스턴스가 포함된 인스턴스에 대한 복구가 지원되지 않습니다.

간소화된 자동 복구를 비활성화하지 않아도 Amazon CloudWatch 경보를 사용하여 인스턴스를 복구할 수 있습니다. 인스턴스를 복구하는 Amazon CloudWatch경보를 생성하는 방법에 대한 자세한 내용은 Amazon CloudWatch 경보에 복구 작업 추가를 참조하세요.

인스턴스 복구 실패 문제 해결

다음 문제로 인해 인스턴스의 자동 복구가 실패할 수 있습니다.

  • Service Health Dashboard 이벤트 또는 기본 랙에 영향을 주는 이벤트입니다. 이러한 이벤트 동안 간소화된 자동 복구는 인스턴스를 복구하지 않습니다. 이러한 이벤트에 대한 복구 실패 알림은 수신되지 않습니다. 진행 중인 Service Health Dashboard 이벤트는 Amazon CloudWatch 작업 기반 복구가 인스턴스를 성공적으로 복구하지 못하게 할 수도 있습니다. http://status.aws.amazon.com/에서 최신 서비스 가용성을 참조하세요.

  • 대체 하드웨어의 일시적인 용량 부족

  • 인스턴스에 인스턴스 스토어 스토리지가 연결되었으나, 자동 인스턴스 복구용으로 지원되지 않는 구성입니다.

  • 인스턴스 복구 시도가 하루 최대 허용 횟수인 3회에 도달했습니다.

자동 복구 프로세스는 매일 최대 3회의 개별 실패에 대해서만 인스턴스 복구를 시도합니다. 인스턴스 시스템 상태 확인 실패가 계속되는 경우 인스턴스를 수동으로 중지 및 시작하는 것이 좋습니다. 자세한 정보는 인스턴스 중지 및 시작을 참조하십시오.

자동 복구가 실패하고 원래 시스템 상태 확인 실패의 근본 원인이 하드웨어 성능 저하로 확인되는 경우, 이후에 인스턴스가 종료될 수 있습니다.