Principais conceitos e definições para instâncias expansíveis - Amazon Elastic Compute Cloud

Principais conceitos e definições para instâncias expansíveis

Os tipos de instância do Amazon EC2 tradicionais fornecem recursos fixos de CPU, enquanto as instâncias expansíveis fornecem um nível de linha de base de uso de CPU com capacidade para expandir o uso de CPU acima desse nível da linha de base. Isso garante que você pague somente pela CPU de linha de base, além dos usos adicionais de CPU de expansão, resultando em custos de computação mais baixos. O uso de linha de base e a capacidade de intermitência são governados por créditos de CPU. As instâncias expansíveis são os únicos tipos de instância que usam créditos para uso de CPU.

Cada instância expansível ganha crédito continuamente quando permanece abaixo da linha de base da CPU e gasta créditos continuamente quando expande acima da linha de base. A quantidade de créditos obtidos ou gastos depende do uso da CPU da instância:

  • Se a utilização da CPU for maior do que linha de base, os créditos gastos serão maiores do que os créditos obtidos.

  • Se a utilização da CPU for igual à linha de base, os créditos obtidos serão iguais aos créditos gastos.

  • Se a utilização da CPU for maior do que linha de base, os créditos gastos serão maiores do que os créditos obtidos.

Quando os créditos obtidos são maiores do que os créditos gastos, a diferença é chamada de créditos acumulados, que podem ser usados posteriormente para expandir acima da utilização da CPU de linha de base. Da mesma forma, quando os créditos gastos são maiores do que créditos obtidos, o comportamento da instância depende do modo de configuração de crédito (modo padrão ou modo ilimitado).

No modo padrão, quando os créditos gastos são maiores do que os créditos obtidos, a instância usa os créditos acumulados para expandir acima da utilização da CPU de linha de base. Se não houver mais créditos acumulados, a instância se reduzirá gradualmente à utilização da CPU de linha de base e não poderá expandir acima da linha de base até acumular mais créditos.

No modo ilimitado, se a instância expandir acima da utilização da CPU de linha de base, a instância usará primeiro os créditos acumulados para expandir. Se não houver mais créditos acumulados, a instância gastará créditos excedentes para expandir. Quando sua utilização de CPU ficar abaixo da linha de base, ela usará os créditos de CPU que ela ganhar para pagar os créditos excedentes gastos anteriormente. A capacidade de ganhar créditos de CPU para pagar créditos excedentes permite que o Amazon EC2 mantenha a média de utilização de CPU de uma instância em um período de 24 horas. Se o uso médio da CPU durante um período de 24 horas exceder a linha de base, a instância será cobrada pelo uso adicional em uma taxa adicional fixa por hora de vCPU.

Principais conceitos e definições

Os principais conceitos e definições a seguir são aplicáveis a instâncias expansíveis.

Utilização da CPU

Utilização de CPU é o percentual de unidades de processamento EC2 alocadas que estão em uso na instância no momento. Essa métrica mede a porcentagem de ciclos de CPU alocados que estão sendo utilizados em uma instância. A métrica CPU Utilization do CloudWatch mostra o uso da CPU por instância e não o uso da CPU por núcleo. A especificação de CPU de linha de base de uma instância também se baseia no uso da CPU por instância. Para medir a utilização da CPU usando o AWS Management Console ou a AWS CLI, consulte Obter estatísticas para uma instância específica.

Crédito da CPU

Uma unidade de VCPU-time.

Exemplos:

1 crédito de CPU = 1 vCPU * 100% de utilização * 1 minuto.

1 crédito de CPU = 1 vCPU * 50% de utilização * 2 minutos

1 crédito de CPU = 2 vCPUs * 25% de utilização * 2 minutos

Utilização da linha de base

A utilização da linha de base é o nível no qual a CPU pode ser utilizada para um saldo de crédito líquido de zero, quando o número de créditos de CPU que estão sendo obtidos corresponde ao número de créditos de CPU que estão sendo usados. A utilização da linha de base também é conhecida como a linha de base. A utilização da linha de base é expressa como uma porcentagem da utilização da vCPU, que é calculada da seguinte forma: % da utilização da linha de base = (número de créditos ganhos/número de vCPUs)/60 minutos

Créditos ganhos

Créditos obtidos continuamente por uma instância quando ela está em execução.

Número de créditos ganhos por hora = % de utilização da linha de base * número de vCPUs * 60 minutos

Exemplo:

Um t3.nano com 2 vCPUs e utilização de linha de base de 5% ganha 6 créditos por hora, calculados da seguinte forma:

2 vCPUs * 5% da linha de base * 60 minutos = 6 créditos por hora

Créditos gastos ou usados

Créditos usados continuamente por uma instância quando ela está em execução.

Créditos de CPU gastos por minuto = Número de vCPUs * utilização da CPU * 1 minuto

Créditos acumulados

Créditos de CPU que não são gastos quando uma instância usa menos créditos do que o necessário para a utilização da linha de base. Em outras palavras, créditos acumulados = (Créditos obtidos - Créditos usados) abaixo da linha de base.

Exemplo:

Se um t3.nano estiver sendo executado com 2% de utilização da CPU, que está abaixo de sua linha de base de 5% por uma hora, os créditos acumulados serão calculados da seguinte forma:

Créditos de CPU acumulados = (Créditos obtidos por hora - Créditos usados por hora) = 6 - 2 vCPUs * 2% de utilização da CPU * 60 minutos = 6 - 2,4 = 3,6 créditos acumulados por hora

Limite de acúmulo de créditos

Depende do tamanho da instância, mas em geral é igual ao número máximo de créditos obtidos em 24 horas.

Exemplo:

Para t3.nano, o limite de crédito acumulado = 24 * 6 = 144 créditos

Créditos de execução

Aplicável somente a instâncias T2 configuradas para o modo padrão. Os créditos de inicialização são um número limitado de créditos de CPU alocados para uma nova instância T2, de modo que, quando iniciada no modo padrão, possa expandir acima da linha de base.

Créditos excedentes

Créditos que são gastos por uma instância após esgotar o saldo de crédito acumulado. Os créditos excedentes são projetados para instâncias intermitentes para sustentar alta performance por um longo período e são usados somente no modo ilimitado. O saldo de créditos excedentes é usado para determinar quantos créditos foram usados pela instância para expandir no modo ilimitado.

Modo padrão

Modo de configuração de crédito, que permite que uma instância se expanda acima da linha de base, gastando créditos acumulados no saldo de crédito.

Modo ilimitado

Modo de configuração de crédito, que permite que uma instância se expanda acima da linha de base, sustentando alta utilização da CPU por qualquer período, sempre que necessário. O preço por hora da instância cobre automaticamente todos os picos de uso da CPU se a utilização média de CPU da instância for igual ou menor que a linha de base durante um período contínuo de 24 horas ou durante a vida útil da instância, o que for menor. Se a instância funcionar com maior utilização de CPU por um período prolongado, ela poderá fazer isso por uma taxa adicional uniforme por hora de vCPU.

A tabela a seguir resume as principais diferenças de crédito entre os tipos de instância expansível.

Type Tipo de créditos de CPU compatíveis Modos de configuração de crédito Vida útil de créditos de CPU acumulados entre a inicialização e a interrupção da instância
Última geração
T4g

Créditos obtidos, créditos acumulados, créditos gastos, créditos excedentes (somente no modo ilimitado)

Padrão, ilimitado (padrão)

7 dias (os créditos permanecem por 7 dias após a interrupção de uma instância)

T3a

Créditos obtidos, créditos acumulados, créditos gastos, créditos excedentes (somente no modo ilimitado)

Padrão, ilimitado (padrão)

7 dias (os créditos permanecem por 7 dias após a interrupção de uma instância)

T3

Créditos obtidos, créditos acumulados, créditos gastos, créditos excedentes (somente no modo ilimitado)

Padrão, ilimitado (padrão)

7 dias (os créditos permanecem por 7 dias após a interrupção de uma instância)

Geração anterior
T2

Créditos obtidos, créditos acumulados, Créditos gastos, créditos de inicialização (somente no modo padrão), créditos excedentes (somente no modo ilimitado)

Standard (padrão), ilimitado

0 dias (os créditos são perdidos quando uma instância é interrompida)

nota

O modo ilimitado não é compatível com instâncias T3 que são iniciadas em um Host Dedicado.

Ganhe créditos de CPU

Cada instância expansível ganha continuamente (a uma resolução no nível de milissegundo) uma taxa definida de créditos de CPU por hora, de acordo com o tamanho da instância. O processo de contabilidade de se os créditos são acumulados ou gastos também ocorre em uma resolução em nível de milissegundo, portanto, você não precisa se preocupar com gastos excessivos de créditos de CPU. Uma intermitência curta da CPU usa uma pequena fração de um crédito de CPU.

Se uma instância expansível usar menos recursos de CPU do que o necessário para o uso de linha de base (como, por exemplo, quando está inativa), os créditos de CPU não gastos serão acumulados no saldo de créditos de CPU. Se uma instância expansível precisar de intermitência acima do nível do uso da linha de base, ela gastará os créditos acumulados. Quanto mais créditos a instância expansível acumular, mais tempo de intermitência ela poderá ter acima da linha de base quando mais uso de CPU for necessário.

A tabela a seguir lista os tipos de instância expansível, a taxa na qual os créditos de CPU são ganhos por hora, o número máximo de créditos de CPU ganhos que uma instância pode acumular, o número de vCPUs por instância e o uso da linha de base como uma porcentagem do total de um núcleo (usando uma única vCPU).

Tipo de instância

Créditos de CPU ganhos por hora

Máximo de créditos obtidos que podem ser acumulados*

vCPUs***

Utilização da linha de base por vCPU

T2

t2.nano

3

72

1

5%

t2.micro

6

144

1

10%

t2.small

12

288

1

20%

t2.medium

24

576

2

20%**

t2.large

36

864

2

30%**

t2.xlarge

54

1296

4

22,5%**

t2.2xlarge

81.6

1958.4

8

17%**

T3

t3.nano

6

144

2

5%**

t3.micro

12

288

2

10%**

t3.small

24

576

2

20%**

t3.medium

24

576

2

20%**

t3.large

36

864

2

30%**

t3.xlarge

96

2304

4

40%**

t3.2xlarge

192

4608

8

40%**

T3a

t3a.nano

6

144

2

5%**

t3a.micro

12

288

2

10%**

t3a.small

24

576

2

20%**

t3a.medium

24

576

2

20%**

t3a.large

36

864

2

30%**

t3a.xlarge

96

2304

4

40%**

t3a.2xlarge

192

4608

8

40%**

T4g

t4g.nano

6

144

2

5%**

t4g.micro

12

288

2

10%**

t4g.small

24

576

2

20%**

t4g.medium

24

576

2

20%**

t4g.large

36

864

2

30%**

t4g.xlarge

96

2304

4

40%**

t4g.2xlarge

192

4608

8

40%**

* O número de créditos que podem ser acumulados é equivalente ao número de créditos que podem ser obtidos em um período de 24 horas.

**A porcentagem de utilização da linha de base na tabela é por vCPU. Em CloudWatch, a utilização da CPU é exibida por vCPU. Por exemplo, a utilização de CPU para uma instância t3.large que opera no nível de linha de base é mostrada como 30% nas métricas de CPU do CloudWatch. Para obter informações sobre como calcular a utilização da linha de base, consulte Utilização da linha de base.

*** Cada vCPU é uma thread de um núcleo Intel Xeon ou de um núcleo AMD EPYC, exceto para instâncias T2 e T4g.

Taxa de ganhos de créditos de CPU

O número de créditos de CPU ganhos por hora é determinado pelo tamanho da instância. Por exemplo, t3.nano ganha seis créditos por hora, enquanto t3.small ganha 24 créditos por hora. A tabela anterior lista a taxa de ganhos de crédito de todas as instâncias.

Limite de acúmulo de créditos de CPU

Embora os créditos obtidos nunca expirem em uma instância em execução, há um limite para o número de créditos obtidos que uma instância pode acumular. O limite é determinado pelo limite de saldo de créditos de CPU. Após o limite ser atingido, todos os créditos novos que foram ganhos serão rejeitados, como indicado na imagem a seguir. O bucket completo indica o limite de saldo de créditos de CPU, e o spillover indica os créditos ganhos recentemente que excedem o limite.

O limite de saldo de créditos de CPU difere para cada tamanho de instância de Por exemplo, uma instância t3.micro pode acumular no máximo 288 créditos no saldo de créditos de CPU. A tabela anterior lista o número máximo de créditos ganhos que cada instância pode acumular.

As instâncias T2 padrão também ganham créditos de execução. Os créditos de execução não são contabilizados para o limite de sado de créditos de CPU. Se uma instância T2 não gastar os créditos de execução e permanecer ociosa por um período de 24 horas, acumulando os créditos obtidos, seu saldo de créditos de CPU serão exibidos como acima do limite. Para obter mais informações, consulte Créditos de execução.

As instâncias T4g, T3a e T3 não ganham créditos de inicialização. Essas instâncias são executadas como unlimited por padrão e, portanto, podem apresentar intermitência imediatamente desde o início, sem nenhum crédito de execução. Instâncias T3 iniciadas em um lançamento de Host Dedicado como standard por padrão, o modo de>unlimited não é compatível para instâncias T3 em um Host Dedicado.

Duração dos créditos de CPU acumulados

Os créditos de CPU de uma instância em execução não expiram.

Para T2, o saldo de créditos de CPU não persiste entre interrupções e inicializações da instância. Se você interromper uma instância T2, a instância perderá todos os créditos acumulados.

Para T4g, T3a e T3, o saldo de créditos de CPU persiste durante sete dias após uma instância ser interrompida, e os créditos são perdidos após esse período. Se você iniciar a instância dentro de sete dias, nenhum crédito será perdido.

Para obter mais informações, consulte CPUCreditBalance na Tabela de métricas do CloudWatch.

Utilização da linha de base

A utilização da lista de base é o nível no qual a CPU pode ser utilizada para um saldo de crédito líquido igual a zero, quando o número de créditos de CPU obtidos correspondem ao número de créditos de CPU usados. A utilização da linha de base também é conhecida como a linha de base.

A utilização da linha de base é expressa como uma porcentagem da utilização da vCPU, que é calculada da seguinte forma:

(number of credits earned/number of vCPUs)/60 minutes = % baseline utilization

Por exemplo, uma instância t3.nano, com 2 vCPUs, ganha 6 créditos por hora, resultando em uma utilização de linha de base de 5%, que é calculada da seguinte forma:

(6 credits earned/2 vCPUs)/60 minutes = 5% baseline utilization

Uma instância t3.xlarge, com 4 vCPUs, ganha 96 créditos por hora, resultando em uma utilização de linha de base de 40% ((96/4)/60).

O gráfico a seguir fornece um exemplo de t3.large com utilização média da CPU abaixo da linha de base.