SUS02-BP01 워크로드 인프라를 동적으로 규모 조정 - AWS Well-Architected 프레임워크

SUS02-BP01 워크로드 인프라를 동적으로 규모 조정

클라우드의 탄력성을 활용하고 인프라를 동적으로 조정하여, 클라우드 리소스 공급을 수요에 맞게 조정하고 워크로드의 용량 초과 프로비저닝을 방지할 수 있습니다.

일반적인 안티 패턴:

  • 사용자 로드에 따라 인프라를 확장하지 않습니다.

  • 항상 인프라를 수동으로 확장합니다.

  • 조정 이벤트 후에 다시 스케일 다운하는 대신 증가된 용량을 그대로 둡니다.

이 모범 사례 확립의 이점: 워크로드 탄력성을 구성하고 테스트하면 클라우드 리소스 공급을 수요에 효율적으로 일치시키고 과도한 프로비저닝을 방지할 수 있습니다. 클라우드의 탄력성을 활용하여 수요가 급증하는 도중과 그 이후에 용량을 자동으로 조정하여 비즈니스 요구 사항을 충족하는 데 필요한 리소스만큼만 사용할 수 있습니다.

이 모범 사례가 확립되지 않을 경우 노출되는 위험 수준: 중간

구현 가이드

클라우드는 수요 변화에 맞춰 다양한 메커니즘을 통해 리소스를 동적으로 확장 또는 축소할 수 있는 유연성을 제공합니다. 공급과 수요를 최적으로 일치시키면 워크로드 환경에 미치는 영향이 최소화됩니다.

수요는 고정되거나 가변적일 수 있으므로 관리에 부담이 되지 않도록 측정 기준과 자동화가 필요합니다. 애플리케이션은 인스턴스 크기를 수정하여 수직(위로 또는 아래로)으로 확장하거나 인스턴스 수를 수정하여 수평(안 또는 밖으로)으로 확장하거나 둘을 모두 조합하여 확장할 수 있습니다.

다양한 접근 방식을 사용하여 리소스 공급과 수요를 일치시킬 수 있습니다.

  • 타겟 추적 접근 방식: 규모 조정 지표를 모니터링하고 필요에 따라 용량을 자동으로 늘리거나 줄입니다.

  • 예측 규모 조정: 일별 및 주별 추세를 고려하여 스케일 인합니다.

  • 일정 기반 접근 방식: 예측 가능한 로드 변화에 따라 자체 규모 조정 일정을 설정합니다.

  • 서비스 규모 조정: 기본적으로 설계별로 규모 조정되는 서버리스와 같은 서비스를 선택하거나 Auto Scaling을 기능으로 제공합니다.

활용률이 낮거나 없는 기간을 식별하고 리소스의 크기를 조정하여 초과 용량을 제거하고 효율성을 개선합니다.

구현 단계

  • 탄력성은 보유한 리소스의 공급을 해당 리소스의 수요에 맞춥니다. 인스턴스, 컨테이너 및 함수는 자동 규모 조정과 함께 또는 서비스의 기능을 사용하여 탄력성을 지원하는 메커니즘을 제공합니다. AWS는 사용자 로드가 적은 기간에 워크로드를 빠르고 쉽게 스케일 다운할 수 있도록 다양한 Auto Scaling 메커니즘을 제공합니다. 다음은 Auto Scaling 메커니즘 예제입니다.

    Auto Scaling 메커니즘 사용 장소

    Amazon EC2 Auto Scaling

    애플리케이션의 사용자 로드를 처리하는 데 사용할 수 있는 적절한 수의 Amazon EC2 인스턴스가 있는지 확인하는 데 사용합니다.

    Application Auto Scaling

    Lambda 함수 또는 Amazon Elastic Container Service(Amazon ECS) 서비스와 같이 Amazon EC2 이외의 개별 AWS 서비스에서 리소스 규모를 자동으로 조정하는 데 사용합니다.

    Kubernetes Cluster Autoscaler

    AWS에서 Kubernetes 클러스터를 자동으로 조정하는 데 사용합니다.

  • 규모 조정은 대개 Amazon EC2 인스턴스나 AWS Lambda 함수 등의 컴퓨팅 서비스와 관련하여 설명하는 경우가 많습니다. Amazon DynamoDB 읽기/쓰기 용량 단위나 Amazon Kinesis Data Streams 샤드와 같은 컴퓨팅 외의 서비스를 구성할 때는 수요에 일치시키는 것이 좋습니다.

  • 스케일 업 또는 스케일 다운에 대한 지표가 배포 중인 워크로드 유형에 대해 검증되었는지 확인합니다. 동영상 트랜스코딩 애플리케이션을 배포하는 경우 100%의 CPU 활용률이 예상되므로, 기본 지표로 사용해서는 안 됩니다. 필요한 경우 규모 조정 정책에 사용자 지정 지표(예: 메모리 사용률)를 사용할 수 있습니다. 올바른 지표를 선택하려면 Amazon EC2에 대한 다음 지침을 고려하세요.

    • 지표는 유효한 사용률 지표여야 하며 인스턴스가 얼마나 많이 사용되는지를 설명해야 합니다.

    • 지표 값은 Auto Scaling 그룹의 인스턴스 수에 비례하여 증가하거나 감소합니다.

  • Auto Scaling 그룹의 경우 수동 규모 조정 대신 동적 규모 조정을 사용합니다. 또한 동적 규모 조정에서 목표 추적 조정 정책을 사용하는 것이 좋습니다.

  • 워크로드 배포에서 스케일 아웃 및 스케일 인 이벤트를 모두 처리할 수 있는지 확인합니다. 스케일 인 이벤트에 대한 테스트 시나리오를 생성하여 워크로드가 예상대로 작동하고 사용자 환경에 영향(예: 스티키 세션 손실)을 미치지 않는지 확인합니다. 활동 내역을 사용하여 Auto Scaling 그룹의 조정 활동을 확인할 수 있습니다.

  • 워크로드의 예측 가능한 패턴을 평가하고 예측 및 계획된 수요 변화에 따라 사전 예방적으로 확장합니다. 예측 규모 조정에서는 용량을 과도하게 프로비저닝할 필요가 없습니다. 자세한 내용은 Predictive Scaling with Amazon EC2 Auto Scaling을 참조하세요.

리소스

관련 문서:

관련 비디오:

관련 예제: