Cotas Lambda - AWS Lambda

Cotas Lambda

O AWS Lambda foi projetado para escalar rapidamente para atender à demanda, permitindo que suas funções aumentem a escala verticalmente para atender ao tráfego em sua aplicação. O Lambda foi projetado para tarefas computacionais de curta duração que não retêm nem dependem do estado entre invocações. O código pode ser executado por até 15 minutos em uma única invocação, e uma única função pode usar até 10.240 MB de memória.

É importante entender as barreiras que são implementadas para proteger sua conta e as workloads de outros clientes. O Service Quotas está disponível em todos os serviços da AWS e consistem em limites rígidos, que você não pode alterar, e limites flexíveis, para os quais você pode solicitar aumentos. Por padrão, todas as novas contas recebem um perfil de cota que permite a exploração dos serviços da AWS.

Para ver as cotas que se aplicam à sua conta, navegue até o painel do Service Quotas. Aqui, você pode visualizar suas cotas de serviço, solicitar um aumento de cota e visualizar a utilização atual. Nesse painel, você pode fazer uma busca detalhada por um serviço específico da AWS, como o Lambda:

design de aplicações figura 1
Importante

Novas Contas da AWS reduziram as cotas de simultaneidade e de memória. A AWS aumenta essas cotas automaticamente com base na utilização.

As seções abaixo listam cotas e limites padrão no Lambda por categoria.

Computação e armazenamento

O Lambda define cotas para a quantidade de recursos computacionais e de armazenamento que você pode usar para executar e armazenar funções. As cotas para execuções simultâneas e armazenamento são aplicadas por Região da AWS. As cotas de interface de rede elástica (ENI) se aplicam por nuvem privada virtual (VPC), qualquer que seja a região. As cotas a seguir podem ser aumentadas dos valores padrão. Para obter mais informações, consulte Solicitar um aumento da cota no Manual do usuário do Service Quotas.

Recurso Cota padrão Pode ser aumentado até

Execuções simultâneas

1.000

Dezenas de milhares

Armazenamento para funções carregadas (arquivos .zip) e camadas. Cada versão da função e versão da camada consome armazenamento.

Para práticas recomendadas para o gerenciamento do armazenamento do seu código, consulte Monitoring Lambda code storage no Serverless Land.

75 GB

Terabytes

Armazenamento para funções definidas como imagens de contêiner Essas imagens são armazenadas no Amazon ECR.

Consulte Cotas de serviço do Amazon ECR.

Interfaces de rede elásticas por Virtual Private Cloud (VPC)

nota

Esta cota é compartilhada com outros serviços, como o Amazon Elastic File System (Amazon EFS). Consulte Cotas da Amazon VPC.

500

Milhares

Para obter detalhes sobre a simultaneidade e sobre como o Lambda dimensiona a simultaneidade da função em resposta ao tráfego, consulte Como entender a escalabilidade da função do Lambda.

Configuração, implantação e execução de funções

As cotas a seguir se aplicam à configuração de funções, às implantações e à execução. Exceto quando indicado, elas não podem ser alteradas.

nota

A documentação do Lambda, as mensagens de log e o console usam a abreviatura MB (em vez de MiB) para se referir a 1.024 KB.

Recurso Quota

Alocação de memória da função

128 MB a 10.240 MB, em incrementos de 1 MB.

Observação: o Lambda aloca capacidade da CPU na proporção da quantidade de memória configurada. Você pode aumentar ou diminuir a memória e a potência da CPU alocada para a função usando a configuração Memória (MB). Com 1.769 MB, uma função tem o equivalente a uma vCPU.

Tempo limite da função

900 segundos (15 minutos)

Variáveis de ambiente da função

4 KB, para todas as variáveis de ambiente associadas à função, em agregado

Política baseada em recursos da função

20 KB

Função camadas

cinco camadas

Limite de escalabilidade de simultaneidade de funções

Para cada função, mil ambientes de execução a cada dez segundos

Carga da invocação (solicitação e resposta)

6 MB cada para solicitação e resposta (síncrona)

20 MB para cada resposta transmitida (Síncrono. O tamanho da carga útil para respostas transmitidas pode ser aumentado em relação aos valores padrão. Entre em contato com o Suporte para saber mais.)

256 KB (assíncrona)

1 MB para o tamanho total combinado dos valores de linha e de cabeçalho da solicitação

Largura de banda para respostas enviadas por streamig

Ilimitada para os primeiros 6 MB da resposta da função

Para respostas maiores que 6 MB, 2 MBps para o restante da resposta

Tamanho dopacote de implantação (arquivo .zip)

50 MB (compactado, quando carregado por meio dos SDKs ou da API do Lambda). Carregue arquivos maiores com o Amazon S3.

50 MB (quando carregado pelo console do Lambda)

250 MB O tamanho máximo do conteúdo de um pacote de implantação, inclusive camadas e runtimes personalizados (descompactado).

Tamanho das configurações de imagem de contêiner

16 KB

Tamanho do pacote do código da imagem do contêiner

10 GB (tamanho máximo de imagem descompactada, incluindo todas as camadas)

Eventos de teste (editor de console)

10

Armazenamento do diretório do /tmp

Entre 512 MB e 10.240 MB, em incrementos de 1 MB

Descrições do arquivo

1,024

Processos de execução/threads

1,024

Solicitações da API do Lambda

As cotas a seguir estão associadas a solicitações de API do Lambda.

Recurso Quota

Solicitações de invocação por função por região (síncronas)

Cada instância do ambiente de execução pode atender até dez solicitações por segundo. Em outras palavras, o limite total de invocação corresponde a dez vezes o limite de simultaneidade. Consulte Como entender a escalabilidade da função do Lambda.

Solicitações de invocação por função por região (assíncronas)

Cada instância do ambiente de execução pode atender a um número ilimitado de solicitações. Em outras palavras, o limite total de invocação é baseado somente na simultaneidade disponível para a função. Consulte Como entender a escalabilidade da função do Lambda.

Solicitações de invocação por alias ou versão de função (solicitações por segundo)

10 x simultaneidade provisionada alocada

nota

Essa cota se aplica somente às funções que usam simultaneidade provisionada.

Solicitações da API GetFunction

100 solicitações por segundo. Não pode ser aumentado.

Solicitações de API GetPolicy

15 solicitações por segundo. Não pode ser aumentado.

Restante das solicitações da API do ambiente de gerenciamento (exclui solicitações de invocação, GetFunction e GetPolicy)

15 solicitações por segundo em todas as APIs (não 15 solicitações por segundo por API). Não pode ser aumentado.

Outros serviços

Cotas para outros serviços, como o AWS Identity and Access Management (IAM), Amazon CloudFront (Lambda @Edge) e Amazon Virtual Private Cloud (Amazon VPC) podem afetar as funções do Lambda. Para obter mais informações, consulte AWS service (Serviço da AWS) quotas, na Referência geral da Amazon Web Services, e Invocando o Lambda com eventos de outros serviços da AWS.

Muitas aplicações que envolvem o Lambda usam vários serviços da AWS. Como serviços diferentes apresentam cotas diferentes para vários recursos, pode ser desafiador gerenciar essas cotas em toda a aplicação. Por exemplo, o API Gateway tem um limite padrão de controle de utilização de 10.000 solicitações por segundo, enquanto o Lambda tem um limite padrão de simultaneidade de 1.000. Devido a essa incompatibilidade, é possível ter mais solicitações recebidas do API Gateway do que o Lambda é capaz de processar. É possível resolver isso solicitando um aumento do limite de concorrência do Lambda para corresponder ao nível esperado de tráfego.

O teste de carga do aplicativo permite monitorar o desempenho da aplicação de ponta a ponta antes de implantá-la na produção. Durante um teste de carga, você pode identificar quaisquer cotas que talvez atuem como um fator limitante para os níveis de tráfego esperados e tomar as medidas necessárias.