REL07-BP02 워크로드 장애 감지 시 리소스 확보 - 안정성 원칙

REL07-BP02 워크로드 장애 감지 시 리소스 확보

가용성이 영향을 받는 경우 필요에 따라 리소스를 사후에 확장하여 워크로드 가용성을 복원합니다.

먼저 상태 확인과 이러한 확인에 대한 기준을 구성하여 리소스 부족으로 인해 가용성이 영향을 받는 시기를 나타내야 합니다. 그런 다음 적절한 담당자에게 수동으로 리소스 규모를 조정하도록 알리거나 자동화를 시작하여 자동으로 리소스 규모를 조정합니다.

워크로드에 맞게 수동으로 규모를 조정할 수 있습니다. 예를 들어 AWS Management Console 또는 AWS CLI를 통해 Auto Scaling 그룹의 EC2 인스턴스 수를 변경하거나 DynamoDB 테이블의 처리량을 수정할 수 있습니다. 하지만 가능하면 자동화를 사용해야 합니다. 리소스를 확보하거나 조정할 때 자동화 사용을 참조하세요.

원하는 결과: 장애 또는 고객 경험 저하가 감지되면 가용성을 복원하기 위해 규모 조정 활동(자동 또는 수동)이 시작됩니다.

이 모범 사례를 따르지 않을 경우 노출 위험도: 중간

구현 가이드

워크로드의 모든 구성 요소에 대한 관찰성 및 모니터링을 구현하여 고객 경험을 모니터링하고 장애를 감지합니다. 필요한 리소스의 규모를 조정하는 절차를 수동 또는 자동으로 정의합니다. 자세한 내용은 REL11-BP01 워크로드의 모든 구성 요소를 모니터링하여 장애 감지를 참조하세요.

구현 단계

  • 필요한 리소스 규모를 조정하는 절차를 수동 또는 자동으로 정의합니다.

    • 규모 조정 절차는 워크로드 내의 다양한 구성 요소가 어떻게 설계되었는지에 따라 달라집니다.

    • 규모 조정 절차는 사용되는 기본 기술에 따라서도 달라집니다.

      • AWS Auto Scaling을 사용하는 구성 요소는 규모 조정 계획을 사용하여 리소스 규모 조정을 위한 일련의 지침을 구성할 수 있습니다. AWS CloudFormation을 사용하거나 AWS 리소스에 태그를 추가하는 경우 애플리케이션마다 서로 다른 리소스 세트에 규모 조정 계획을 설정할 수 있습니다. Auto Scaling은 각 리소스에 맞춤화된 규모 조정 전략에 대한 권장 사항을 제공합니다. 규모 조정 계획을 생성하면 Auto Scaling이 동적 규모 조정과 예측 규모 조정 방식을 결합하여 규모 조정 전략을 지원합니다. 자세한 내용은 크기 조정 계획 작동 방식을 참조하세요.

      • Amazon EC2 Auto Scaling은 애플리케이션의 로드를 처리하기에 적절한 개수의 Amazon EC2 인스턴스를 확보했는지 확인합니다. Auto Scaling 그룹이라고 하는 EC2 인스턴스 컬렉션을 생성합니다. 각 Auto Scaling 그룹의 최소 및 최대 인스턴스 수를 지정할 수 있으며 Amazon EC2 Auto Scaling은 그룹이 이러한 기준에 미달하거나 기준을 초과하지 않도록 합니다. 자세한 내용은 What is Amazon EC2 Auto Scaling?을 참조하세요.

      • Amazon DynamoDB Auto Scaling은 Application Auto Scaling 서비스를 사용하여 사용자를 대신해 실제 트래픽 패턴에 따라 프로비저닝된 처리량 용량을 동적으로 조정합니다. 따라서 테이블 또는 글로벌 보조 인덱스가 프로비저닝된 읽기 및 쓰기 용량을 늘려 제한 없이 급증하는 트래픽을 처리할 수 있습니다. 자세한 내용은 DynamoDB Auto Scaling을 통한 처리량 자동 관리를 참조하세요.

리소스

관련 모범 사례:

관련 문서: