Conceptos clave y definiciones para las instancias de rendimiento ampliables - Amazon Elastic Compute Cloud

Conceptos clave y definiciones para las instancias de rendimiento ampliables

Los tipos de instancias de Amazon EC2 tradicionales proporcionan recursos de CPU fijos. Por otra parte, las instancias de rendimiento ampliable proporcionan un nivel de base de referencia de utilización de la CPU con posibilidad de ampliarlo por encima de ese nivel de base de referencia. De este modo, se garantiza que solo pague la CPU de base de referencia más cualquier uso ampliado adicional de la CPU, con la consiguiente reducción de los costos de cómputo. La utilización de referencia y la capacidad de ampliar se rigen por créditos de CPU. Las instancias de rendimiento ampliable son los únicos tipos de instancia que usan créditos para el uso de la CPU.

Cada instancia de rendimiento ampliable obtiene continuamente créditos si se mantiene por debajo de la base de referencia de la CPU y también gasta créditos de manera continua si lo supera. La cantidad de créditos que se obtienen o se gastan depende de la utilización de la CPU de la instancia:

  • Si la utilización de la CPU está por debajo de la base de referencia, los créditos que se obtienen son mayores que aquellos que se gastan.

  • Si la utilización de la CPU coincide con la base de referencia, los créditos que se obtienen son iguales que aquellos que se gastan.

  • Si la utilización de la CPU es mayor que la de la base de referencia, los créditos que se gastan son mayores que aquellos que se obtienen.

Cuando los créditos que se obtienen son mayores que los se gastan, entonces la diferencia se denomina créditos acumulados, que se pueden utilizar más adelante para ampliaciones por encima de la utilización de la CPU de base de referencia. Del mismo modo, cuando los créditos que se gastan son más que los que se obtienen, entonces el comportamiento de la instancia depende del modo de configuración de crédito: modo estándar o modo ilimitado.

En el modo estándar, cuando los créditos que se gastan son más que los que se obtienen, la instancia utiliza los créditos acumulados para ampliaciones por encima de la utilización de la CPU de base de referencia. Si no quedan créditos acumulados, la instancia se reduce gradualmente a la utilización de la CPU de base de referencia y no puede ampliarse por encima del nivel de base de referencia hasta tanto no acumule más créditos.

En el modo ilimitado, si la instancia se amplía por encima de la utilización de la CPU de base de referencia, la instancia utiliza en primer lugar los créditos acumulados para hacerlo. En caso de que no queden créditos acumulados, la instancia gasta los créditos sobrantes. Cuando el uso de la CPU cae por debajo de la base de referencia, utiliza los créditos de CPU que obtiene para compensar los créditos sobrantes gastados previamente. La posibilidad de obtener créditos de CPU para compensar créditos sobrantes permite a Amazon EC2 crear una media de utilización de la CPU de una instancia en un periodo de 24 horas. Si la utilización media de la CPU durante un periodo de 24 horas supera la base de referencia, se cobra el uso adicional de la instancia a una tarifa adicional fija por hora de vCPU.

Conceptos y definiciones clave

Los siguientes conceptos y definiciones clave se pueden aplicar a las instancias de rendimiento ampliables.

Utilización de la CPU

La utilización de la CPU es el porcentaje de unidades de cómputo de EC2 asignadas que están actualmente en uso en la instancia. Esta métrica mide el porcentaje de ciclos de la CPU asignados que se están utilizando en una instancia. La métrica de CloudWatch de utilización de la CPU muestra el uso de la CPU por instancia y no el uso por núcleo. La especificación de CPU de base de referencia de una instancia también se basa en el uso de CPU por instancia. Para medir la utilización de la CPU mediante la AWS Management Console o la AWS CLI, consulte Obtener estadísticas para una instancia específica.

Crédito de la CPU

Una unidad de vCPU-time.

Ejemplos:

1 crédito de CPU = 1 vCPU * 100 % de utilización x 1 minuto

1 crédito de CPU = 1 vCPU * 50 % de utilización x 2 minutos

1 crédito de CPU = 2 vCPU * 25 % de utilización x 2 minutos

Utilización de referencia

La utilización de referencia es el nivel en el que se puede utilizar la CPU para un saldo de crédito neto de cero, cuando el número de créditos de CPU que se gana coincide con el que se está utilizando. La utilización de referencia también se conoce como línea base. La utilización de base de referencia se expresa como un porcentaje de utilización de vCPU, que se calcula de la siguiente manera: utilización de base de referencia en % = (número de créditos obtenidos/número de vCPU)/60 minutos.

Para obtener información sobre la utilización básica de cada tipo de instancia de rendimiento con ráfagas, consulte la tabla de créditos.

Créditos obtenidos

Créditos obtenidos continuamente por una instancia mientras se está ejecutando.

Cantidad de créditos obtenidos por hora = % de utilización de base de referencia x cantidad de vCPUs x 60 minutos

Ejemplo:

Una instancia t3.nano con 2 vCPUs y una utilización de base de referencia del 5 % obtiene 6 créditos por hora, que se calculan de la siguiente manera:

2 vCPUs x 5 % de referencia x 60 minutos = 6 créditos por hora

Créditos gastados o utilizados

Créditos utilizados continuamente por una instancia mientras se está ejecutando.

Créditos de CPU que se gastan por minuto = número de vCPUs x utilización de la CPU x 1 minuto

Créditos acumulados

Créditos de CPU que no se han gastado cuando una instancia utiliza menos créditos de los necesarios para la utilización de base de referencia. En otras palabras, créditos acumulados = (créditos obtenidos - créditos utilizados) por debajo de la base de referencia.

Ejemplo:

Si un t3.nano se ejecuta a un 2 % de utilización de la CPU, que se sitúa por debajo de la referencia del 5 % durante una hora, los créditos acumulados se calculan de la siguiente manera:

Créditos de CPU acumulados = (créditos obtenidos por hora - créditos utilizados por hora) = 6 - 2 vCPUs x 2 % de utilización de la CPU x 60 minutos = 6 - 2,4 = 3,6 créditos acumulados por hora

Límite de acumulación de créditos

Depende del tamaño de la instancia, pero en general es igual al número máximo de créditos obtenidos en 24 horas.

Ejemplo:

Para t3.nano, el límite de acumulación de créditos = 24 x 6 = 144 créditos

Créditos de inicialización

Solo se aplica a las instancias T2 configuradas en modo estándar. Los créditos de inicialización constituyen una cantidad limitada de créditos de la CPU que se asignan a una nueva instancia T2 de manera tal que, al ser iniciada en modo estándar, pueda ampliarse por encima de la base de referencia.

Créditos sobrantes

Créditos que se gastan por una instancia una vez que se agota su saldo de crédito acumulado. Los créditos sobrantes están diseñados para que las instancias ampliables mantengan un alto rendimiento durante un periodo prolongado y solo se utilizan en el modo ilimitado. El saldo de créditos sobrantes se emplea para determinar cuántos créditos fueron utilizados por la instancia para la ampliación en modo ilimitado.

Modo estándar

Modo de configuración de créditos, que permite a una instancia ampliarse por encima de la base de referencia mediante el gasto de créditos que se han acumulado en el saldo correspondiente.

Modo ilimitado

Modo de configuración de créditos, que permite a una instancia ampliarse por encima de la base de referencia al mantener una utilización elevada de la CPU durante cualquier periodo siempre que sea necesario. El precio por hora de la instancia cubre automáticamente todos los picos de uso de la CPU si la utilización media de la CPU de una instancia CPU está a la par o por debajo de la base de referencia en un periodo de 24 horas o durante la vida útil de la instancia, lo que dure menos. Si la instancia requiere un mayor uso de la CPU durante un período prolongado, también puede hacerlo por un cargo fijo adicional por hora de vCPU.

En la siguiente tabla, se resumen las principales diferencias de créditos entre los tipos de instancia ampliables.

Tipo Tipo de créditos de CPU admitidos Modos de configuración de créditos Vida útil de los créditos de la CPU acumulados entre los inicios y las detenciones de la instancia.
Última generación
T4g

Créditos obtenidos, créditos acumulados, créditos gastados, créditos sobrantes (solo modo ilimitado)

Estándar, ilimitado (predeterminado)

7 días (los créditos se mantienen durante 7 días después de que se detiene una instancia)

T3a

Créditos obtenidos, créditos acumulados, créditos gastados, créditos sobrantes (solo modo ilimitado)

Estándar, ilimitado (predeterminado)

7 días (los créditos se mantienen durante 7 días después de que se detiene una instancia)

T3

Créditos obtenidos, créditos acumulados, créditos gastados, créditos sobrantes (solo modo ilimitado)

Estándar, ilimitado (predeterminado)

7 días (los créditos se mantienen durante 7 días después de que se detiene una instancia)

Generación anterior
T2

Créditos obtenidos, créditos acumulados, créditos gastados, créditos de inicialización (solo modo estándar), créditos sobrantes (solo modo ilimitado)

Estándar (predeterminado), ilimitado

0 días (los créditos se pierden cuando se detiene una instancia)

nota

El modo ilimitado no es compatible con las instancias T3 que se inician en un host dedicado.

Ganar créditos de CPU

En función de su tamaño, cada instancia de rendimiento ampliable va adquiriendo continuamente (a una resolución de milisegundo) una tasa fija de créditos de CPU por hora. El proceso contable mediante el cual se determina si los créditos se acumulan o se gastan también se realiza a una resolución en el nivel de milisegundos, por lo que no tiene que preocuparse de gastar demasiados créditos de CPU; un pequeño aumento de la CPU solo utiliza una pequeña fracción de un crédito de CPU.

Si una instancia de rendimiento ampliable utiliza menos recursos de CPU que los requeridos para una utilización de referencia (por ejemplo cuando está inactiva), los créditos de CPU no gastados se acumulan en el saldo de créditos de CPU. Si una instancia de rendimiento ampliable tiene que ampliar por encima del nivel de utilización de referencia, gasta los créditos acumulados. Cuantos más créditos haya acumulado la instancia de rendimiento ampliable, más tiempo podrá ampliarse por encima de su nivel de utilización de la CPU cuando sea necesario.

En la siguiente tabla se indican los tipos de instancias de rendimiento ampliable, la tasa de adquisición de créditos por hora, el número máximo de créditos de CPU ganados que puede acumular una instancia, la cantidad de unidades vCPU por instancia y la utilización de referencia como porcentaje del núcleo total (al utilizar una sola vCPU).

Tipo de instancia

Créditos de CPU obtenidos por hora

Créditos máximos ganados que se pueden acumular*

vCPUs***

Utilización de referencia por vCPU

T2

t2.nano

3

72

1

5%

t2.micro

6

144

1

10%

t2.small

12

288

1

20%

t2.medium

24

576

2

20 %**

t2.large

36

864

2

30 %**

t2.xlarge

54

1296

4

22,5 %**

t2.2xlarge

81.6

1958.4

8

17 %**

T3

t3.nano

6

144

2

5 %**

t3.micro

12

288

2

10 %**

t3.small

24

576

2

20 %**

t3.medium

24

576

2

20 %**

t3.large

36

864

2

30 %**

t3.xlarge

96

2304

4

40 %**

t3.2xlarge

192

4608

8

40 %**

T3a

t3a.nano

6

144

2

5 %**

t3a.micro

12

288

2

10 %**

t3a.small

24

576

2

20 %**

t3a.medium

24

576

2

20 %**

t3a.large

36

864

2

30 %**

t3a.xlarge

96

2304

4

40 %**

t3a.2xlarge

192

4608

8

40 %**

T4g

t4g.nano

6

144

2

5 %**

t4g.micro

12

288

2

10 %**

t4g.small

24

576

2

20 %**

t4g.medium

24

576

2

20 %**

t4g.large

36

864

2

30 %**

t4g.xlarge

96

2304

4

40 %**

t4g.2xlarge

192

4608

8

40 %**

* El número de créditos que se pueden acumular es equivalente a la cantidad de créditos que se pueden obtener en un periodo de 24 horas.

** La utilización de referencia de porcentaje en la tabla es por vCPU. En CloudWatch, el uso de la CPU se muestra por vCPU. Por ejemplo, el uso de la CPU de una instancia t3.large que funciona con el nivel de referencia se muestra como un 30 % en las métricas de CPU de CloudWatch. Para obtener información acerca de cómo calcular la utilización de referencia, consulte Utilización de referencia.

*** Cada vCPU es un subproceso de un núcleo Intel Xeon, o bien de un núcleo AMD EPYC, con excepción de las instancias T2 y T4g.

Tasa de obtención de créditos de CPU

El número de créditos de CPU obtenido por hora está determinado por el tamaño de la instancia. Por ejemplo, una t3.nano obtiene seis créditos por hora y una t3.small, 24 por hora. La tabla anterior enumera la tasa de obtención de créditos de todas las instancias.

Límite de acumulación de créditos de CPU

Aunque los créditos obtenidos no caducan nunca en una instancia en ejecución, hay un límite en cuanto al número de créditos obtenidos que una instancia puede acumular. El límite viene determinado por el límite de saldo de créditos de CPU. Una vez que se alcanza el límite, se descarta cualquier nuevo crédito obtenido, tal como se indica en la imagen siguiente. El bucket completo indica el límite de saldo de créditos de CPU y la capacidad superada indica los créditos recién obtenidos que superan el máximo.


               Los nuevos créditos obtenidos se descartan cuando se supera el límite.

El límite de saldo de créditos de CPU varía en función del tamaño de la instancia Por ejemplo, una instancia t3.micro puede acumular un saldo máximo de 288 créditos de CPU en el saldo de créditos de CPU. La tabla anterior enumera la cantidad máxima de créditos obtenidos que puede acumular cada instancia.

Las instancias T2 Standard también adquieren créditos de inicialización. Los créditos de inicialización no cuentan para el límite de saldo de créditos de CPU. Si una instancia T2 no ha gastado sus créditos de inicialización y permanece inactiva durante un periodo de 24 horas mientras acumula créditos ganados, su saldo de créditos de CPU aparecerá por encima del límite. Para obtener más información, consulte Créditos de inicialización.

Las instancias T4g, T3a y T3 no obtienen créditos de inicialización. Estas instancias se inician como unlimited de forma predeterminada y, por tanto, se pueden ampliar inmediatamente tras iniciarse sin tener créditos de inicialización. Las instancias T3 iniciadas en un host dedicado se inician como standard de forma predeterminada; el modo unlimited no se admite para instancias T3 en un host dedicado.

Duración de los créditos de CPU acumulados

Los créditos de CPU de una instancia en ejecución no caducan.

Para T2, el saldo de créditos de CPU no persiste entre paradas e inicios de instancia. Si detiene una instancia T2, la instancia pierde todos sus créditos acumulados.

Para el caso de T4g, T3a y T3, el saldo de créditos de la CPU se mantiene durante siete días después de detenerse una instancia y, luego, se pierden. Si inicia la instancia en un plazo de siete días, no se pierde ningún crédito.

Para obtener más información, consulte CPUCreditBalance en la tabla de métricas de CloudWatch.

Utilización de referencia

La utilización de referencia es el nivel en el que se puede utilizar la CPU para un saldo de crédito neto de cero, cuando el número de créditos de CPU que se gana coincide con el que se está utilizando. La utilización de referencia también se conoce como línea base.

La utilización de referencia se expresa como un porcentaje de la utilización de la vCPU, que se calcula de la siguiente manera:

(number of credits earned/number of vCPUs)/60 minutes = % baseline utilization

Por ejemplo, una instancia t3.nano, con 2 vCPU, obtiene 6 créditos por hora, lo que genera una utilización de referencia del 5 %, que se calcula de la siguiente manera:

(6 credits earned/2 vCPUs)/60 minutes = 5% baseline utilization

Una instancia t3.large, con 2 vCPU, obtiene 36 créditos por hora, lo que genera una utilización de línea de base del 30 % ((36/2)/60).

En el siguiente gráfico, se proporciona un ejemplo de una instancia t3.large con una utilización promedio de la CPU por debajo de la línea de base.


               Gráfico de una instancia t3.large con una utilización promedio de la CPU por debajo de la línea de base.