AWS Lambda
개발자 가이드

AWS Lambda 함수 규모 조정

함수를 최초로 호출하면 AWS Lambda는 함수의 인스턴스를 생성하고 핸들러 메서드를 실행하여 이벤트를 처리합니다. 함수가 응답을 반환하면 Lambda는 계속 머무르면서 추가 이벤트를 처리합니다. 첫 번째 이벤트가 처리되는 도중에 함수를 다시 호출하면 Lambda는 다른 인스턴스를 생성합니다.

이벤트가 추가로 수신되면 Lambda는 이 이벤트를 사용 가능한 인스턴스로 라우팅하고 필요 시 새 인스턴스를 생성합니다. 함수의 동시성은 특정 시각에 요청을 처리하는 인스턴스의 수입니다. 최초 트래픽 버스트의 경우 함수의 동시성은 500~3000의 최초 레벨에 이를 수 있으며, 이는 리전에 따라 달라집니다.

최초 동시성 버스트 한도

  • 3000 – 미국 서부(오레곤), 미국 동부(버지니아 북부), EU(아일랜드).

  • 1000 – 아시아 태평양(도쿄), EU(프랑크푸르트).

  • 500 – 기타 리전.

최초 버스트 이후 함수의 동시성은 매분 500개의 추가 인스턴스까지 확장될 수 있습니다. 이러한 확장은 모든 요청을 처리할 만큼 인스턴스가 충분해질 때까지 또는 동시성 한도에 이를 때까지 계속됩니다. 요청의 수가 감소하면 Lambda는 미사용 인스턴스를 중단하여 다른 함수를 위한 용량 조정에 필요한 여유를 확보합니다.

리전별 동시성 한도는 1,000에서 시작하며 Support Center 콘솔에서 요청을 제출하여 높일 수 있습니다. 함수 단위로 규모 조정을 제한하고 용량을 할당하려면 예약된 동시성으로 함수를 구성하면 됩니다.

함수가 확장하는 속도보다 더 빠르게 요청이 수신되거나 함수가 최대 동시성에 도달한 경우 추가 요청은 조절 오류(429 상태 코드)로 인해 실패합니다. 함수를 직접 호출하는 경우 이것을 재시도 가능한 오류로 취급해야 합니다.

이벤트 소스 매핑 또는 다른 AWS 서비스를 통해 함수를 비동기식으로 호출하는 경우 확장 동작은 달라집니다. 예를 들어 스트림에서 읽는 이벤트 소스 매핑은 스트림 내 샤드 수를 넘어 확장하지 않습니다. 이벤트 소스에서 사용하지 않는 확장 용량은 다른 클라이언트 및 이벤트 소스에서 사용할 수 있습니다. 자세한 내용은 다음 항목을 참조하십시오.

ConcurrentExecutionsUnreservedConcurrentExecutions 지표를 이용해 계정 내 동시성 레벨을 모니터링할 수 있습니다. 자세한 내용은 AWS Lambda 지표 단원을 참조하십시오.