Comportamento de escalabilidade do Lambda - AWS Lambda

Comportamento de escalabilidade do Lambda

À medida que sua função recebe mais solicitações, o Lambda aumenta automaticamente a escala do número de ambientes de execução para processar essas solicitações até que seja atingido o limite de simultaneidade da sua conta. No entanto, para evitar que o limite de escalabilidade seja ultrapassado em resposta a picos repentinos de tráfego, o Lambda limita a velocidade do ajuste de escala das funções. Essa taxa de escalabilidade de simultaneidade é a taxa máxima na qual as funções em sua conta podem ser escaladas em resposta ao aumento de solicitações. Ou seja, a velocidade com que o Lambda é capaz de criar novos ambientes de execução. A taxa de escalabilidade de simultaneidade difere do limite de simultaneidade no nível da conta, que é a quantidade total de simultaneidade disponível para suas funções.

Taxa de escalabilidade da simultaneidade

Em cada Região da AWS, e para cada função, sua taxa de escalabilidade de simultaneidade é de mil instâncias de ambiente de execução a cada dez segundos. Em outras palavras, a cada dez segundos, o Lambda pode alocar no máximo mil instâncias adicionais de ambiente de execução para cada uma das suas funções.

Normalmente, você não precisa se preocupar com esse limite. A taxa de escalabilidade do Lambda é suficiente para a maioria dos casos de uso.

É importante ressaltar que a taxa de escalabilidade de simultaneidade é um limite no nível da função. Isso significa que cada função da sua conta pode ajustar a escala independentemente de outras funções.

nota

Na prática, o Lambda faz o possível para reabastecer sua taxa de escalabilidade de simultaneidade continuamente, em vez de fazer uma única recarga de mil unidades a cada 10 segundos.

O Lambda não acumula partes não utilizadas da taxa de escalabilidade de simultaneidade. Isso significa que sua taxa de escalabilidade será sempre de mil unidades simultâneas, no máximo. Por exemplo, se você não usar nenhuma das mil unidades de simultaneidade disponíveis em um intervalo de 10 segundos, não acumulará mil unidades adicionais para o próximo intervalo de 10 segundos. Sua taxa de escalabilidade de simultaneidade ainda será de mil no próximo intervalo de 10 segundos.

Enquanto sua função continuar recebendo um número cada vez maior de solicitações, o Lambda ajustará a escala com a taxa mais rápida disponível para você, até o limite de simultaneidade da sua conta. Para limitar o valor de simultaneidade das funções individuais, é necessário configurar a simultaneidade reservada. Se a quantidade de solicitações recebidas for maior do que a capacidade da função de fazer o ajuste de escala ou se a função já estiver na simultaneidade máxima, as solicitações adicionais vão apresentar falha com um erro de controle de utilização (código de status 429).