Cotas Lambda
O AWS Lambda foi projetado para escalar rapidamente para atender à demanda, permitindo que suas funções aumentem a escala verticalmente para atender ao tráfego em sua aplicação. O Lambda foi projetado para tarefas computacionais de curta duração que não retêm nem dependem do estado entre invocações. O código pode ser executado por até 15 minutos em uma única invocação, e uma única função pode usar até 10.240 MB de memória.
É importante entender as barreiras que são implementadas para proteger sua conta e as workloads de outros clientes. O Service Quotas está disponível em todos os serviços da AWS e consistem em limites rígidos, que você não pode alterar, e limites flexíveis, para os quais você pode solicitar aumentos. Por padrão, todas as novas contas recebem um perfil de cota que permite a exploração dos serviços da AWS.
Para ver as cotas que se aplicam à sua conta, navegue até o painel do Service Quotas

Importante
Novas Contas da AWS reduziram as cotas de simultaneidade e de memória. A AWS aumenta essas cotas automaticamente com base na utilização.
As seções abaixo listam cotas e limites padrão no Lambda por categoria.
Tópicos
Computação e armazenamento
O Lambda define cotas para a quantidade de recursos computacionais e de armazenamento que você pode usar para executar e armazenar funções. As cotas para execuções simultâneas e armazenamento são aplicadas por Região da AWS. As cotas de interface de rede elástica (ENI) se aplicam por nuvem privada virtual (VPC), qualquer que seja a região. As cotas a seguir podem ser aumentadas dos valores padrão. Para obter mais informações, consulte Solicitar um aumento da cota no Manual do usuário do Service Quotas.
Recurso | Cota padrão | Pode ser aumentado até |
---|---|---|
Execuções simultâneas |
1.000 |
Dezenas de milhares |
Armazenamento para funções carregadas (arquivos .zip) e camadas. Cada versão da função e versão da camada consome armazenamento. Para práticas recomendadas para o gerenciamento do armazenamento do seu código, consulte Monitoring Lambda code storage |
75 GB |
Terabytes |
Armazenamento para funções definidas como imagens de contêiner Essas imagens são armazenadas no Amazon ECR. |
Consulte Cotas de serviço do Amazon ECR. |
|
Interfaces de rede elásticas por Virtual Private Cloud (VPC) notaEsta cota é compartilhada com outros serviços, como o Amazon Elastic File System (Amazon EFS). Consulte Cotas da Amazon VPC. |
500 |
Milhares |
Para obter detalhes sobre a simultaneidade e sobre como o Lambda dimensiona a simultaneidade da função em resposta ao tráfego, consulte Como entender a escalabilidade da função do Lambda.
Configuração, implantação e execução de funções
As cotas a seguir se aplicam à configuração de funções, às implantações e à execução. Exceto quando indicado, elas não podem ser alteradas.
nota
A documentação do Lambda, as mensagens de log e o console usam a abreviatura MB (em vez de MiB) para se referir a 1.024 KB.
Recurso | Quota |
---|---|
Alocação de memória da função |
128 MB a 10.240 MB, em incrementos de 1 MB. Observação: o Lambda aloca capacidade da CPU na proporção da quantidade de memória configurada. Você pode aumentar ou diminuir a memória e a potência da CPU alocada para a função usando a configuração Memória (MB). Com 1.769 MB, uma função tem o equivalente a uma vCPU. |
Tempo limite da função |
900 segundos (15 minutos) |
Variáveis de ambiente da função |
4 KB, para todas as variáveis de ambiente associadas à função, em agregado |
Política baseada em recursos da função |
20 KB |
Função camadas |
cinco camadas |
Limite de escalabilidade de simultaneidade de funções |
Para cada função, mil ambientes de execução a cada dez segundos |
Carga da invocação (solicitação e resposta) |
6 MB cada para solicitação e resposta (síncrona) 20 MB para cada resposta transmitida (Síncrono. O tamanho da carga útil para respostas transmitidas pode ser aumentado em relação aos valores padrão. Entre em contato com o Suporte para saber mais.) 256 KB (assíncrona) 1 MB para o tamanho total combinado dos valores de linha e de cabeçalho da solicitação |
Largura de banda para respostas enviadas por streamig |
Ilimitada para os primeiros 6 MB da resposta da função Para respostas maiores que 6 MB, 2 MBps para o restante da resposta |
Tamanho dopacote de implantação (arquivo .zip) |
50 MB (compactado, quando carregado por meio dos SDKs ou da API do Lambda). Carregue arquivos maiores com o Amazon S3. 50 MB (quando carregado pelo console do Lambda) 250 MB O tamanho máximo do conteúdo de um pacote de implantação, inclusive camadas e runtimes personalizados (descompactado). |
Tamanho das configurações de imagem de contêiner |
16 KB |
Tamanho do pacote do código da imagem do contêiner |
10 GB (tamanho máximo de imagem descompactada, incluindo todas as camadas) |
Eventos de teste (editor de console) |
10 |
Armazenamento do diretório do |
Entre 512 MB e 10.240 MB, em incrementos de 1 MB |
Descrições do arquivo |
1,024 |
Processos de execução/threads |
1,024 |
Solicitações da API do Lambda
As cotas a seguir estão associadas a solicitações de API do Lambda.
Recurso | Quota |
---|---|
Solicitações de invocação por função por região (síncronas) |
Cada instância do ambiente de execução pode atender até dez solicitações por segundo. Em outras palavras, o limite total de invocação corresponde a dez vezes o limite de simultaneidade. Consulte Como entender a escalabilidade da função do Lambda. |
Solicitações de invocação por função por região (assíncronas) |
Cada instância do ambiente de execução pode atender a um número ilimitado de solicitações. Em outras palavras, o limite total de invocação é baseado somente na simultaneidade disponível para a função. Consulte Como entender a escalabilidade da função do Lambda. |
Solicitações de invocação por alias ou versão de função (solicitações por segundo) |
10 x simultaneidade provisionada alocada notaEssa cota se aplica somente às funções que usam simultaneidade provisionada. |
Solicitações da API GetFunction |
100 solicitações por segundo. Não pode ser aumentado. |
Solicitações de API GetPolicy |
15 solicitações por segundo. Não pode ser aumentado. |
Restante das solicitações da API do ambiente de gerenciamento (exclui solicitações de invocação, GetFunction e GetPolicy) |
15 solicitações por segundo em todas as APIs (não 15 solicitações por segundo por API). Não pode ser aumentado. |
Outros serviços
Cotas para outros serviços, como o AWS Identity and Access Management (IAM), Amazon CloudFront (Lambda @Edge) e Amazon Virtual Private Cloud (Amazon VPC) podem afetar as funções do Lambda. Para obter mais informações, consulte AWS service (Serviço da AWS) quotas, na Referência geral da Amazon Web Services, e Invocando o Lambda com eventos de outros serviços da AWS.
Muitas aplicações que envolvem o Lambda usam vários serviços da AWS. Como serviços diferentes apresentam cotas diferentes para vários recursos, pode ser desafiador gerenciar essas cotas em toda a aplicação. Por exemplo, o API Gateway tem um limite padrão de controle de utilização de 10.000 solicitações por segundo, enquanto o Lambda tem um limite padrão de simultaneidade de 1.000. Devido a essa incompatibilidade, é possível ter mais solicitações recebidas do API Gateway do que o Lambda é capaz de processar. É possível resolver isso solicitando um aumento do limite de concorrência do Lambda para corresponder ao nível esperado de tráfego.
O teste de carga do aplicativo permite monitorar o desempenho da aplicação de ponta a ponta antes de implantá-la na produção. Durante um teste de carga, você pode identificar quaisquer cotas que talvez atuem como um fator limitante para os níveis de tráfego esperados e tomar as medidas necessárias.