Clúster AutoScaler Escalador automático de clústeres con sobreaprovisionamiento Karpenter

Escalado de computación

El escalado de la computación es un componente fundamental para el rendimiento de las aplicaciones en un entorno dinámico de Kubernetes. Kubernetes reduce el desperdicio mediante el ajuste dinámico de los recursos informáticos (como la CPU y la memoria) en respuesta a la demanda en tiempo real. Esta capacidad ayuda a evitar el aprovisionamiento excesivo o insuficiente, lo que también puede ahorrar gastos operativos. Kubernetes elimina de manera efectiva la necesidad de intervención manual al permitir que la infraestructura se amplíe automáticamente durante las horas pico y disminuya durante los períodos de menor actividad.

El escalado informático general de Kubernetes automatiza el proceso de escalado, lo que aumenta la flexibilidad y la escalabilidad de la aplicación y mejora su comportamiento tolerante a errores. En última instancia, las capacidades de Kubernetes mejoran la excelencia operativa y la productividad.

En esta sección se analizan los siguientes tipos de escalado de cómputo:

Escalador automático de clústeres
Escalador automático de clústeres con sobreaprovisionamiento
Karpenter

Clúster AutoScaler

Según las necesidades de los módulos, la herramienta Cluster Autoscaler modifica automáticamente el tamaño añadiendo nodos cuando es necesario o quitándolos cuando no son necesarios y están infrautilizados.

Considere la herramienta Cluster Autoscaler como una solución de escalado para cargas de trabajo en las que la demanda aumenta gradualmente y la latencia en el escalado no es un problema importante.

La herramienta Cluster Autoscaler ofrece las siguientes funciones clave:

Escalado: escala los nodos hacia arriba y hacia abajo de forma dinámica en respuesta a las demandas reales de recursos.
Programación de módulos: ayuda a garantizar que todos los módulos estén operativos y cuenten con los recursos que necesitan para funcionar, lo que evita la escasez de recursos.
Rentabilidad: elimina los gastos innecesarios de operar nodos infrautilizados al eliminarlos.

Escalador automático de clústeres con sobreaprovisionamiento

El escalador automático de clústeres con sobreaprovisionamiento funciona de manera similar al escalador automático de clústeres, ya que despliega los nodos de manera eficiente y ahorra tiempo al ejecutar módulos de baja prioridad en los nodos. Con esta técnica, el tráfico se redirige a estos módulos en respuesta a picos repentinos de demanda, lo que permite que la aplicación siga funcionando sin interrupciones.

El escalador automático de clústeres con sobreaprovisionamiento ofrece las funciones de los módulos ficticios que se pueden utilizar para implementar y ejecutar nodos fácilmente cuando la carga de trabajo es muy grande, no se necesita latencia y el escalado debe ser rápido.

El escalador automático de clústeres con sobreaprovisionamiento ofrece las siguientes funciones clave:

Mejor capacidad de respuesta: al hacer que el exceso de capacidad esté constantemente accesible, se tarda menos tiempo en ampliar el clúster en respuesta a los picos de demanda.
Reserva de recursos: la gestión eficaz de los picos de tráfico inesperados contribuye a una gestión correcta con poco tiempo de inactividad.
Escalado fluido: minimizar los retrasos en la asignación de recursos facilita un proceso de escalado más fluido.

Karpenter

Karpenter for Kubernetes supera a la herramienta tradicional de escalado automático de clústeres en términos de código abierto, rendimiento y personalización. Con Karpenter, puede lanzar automáticamente solo los recursos informáticos necesarios para gestionar las demandas de su clúster en tiempo real. Karpenter está diseñado para ofrecer un escalado más eficiente y con mayor capacidad de respuesta.

Las aplicaciones con cargas de trabajo extremadamente variables o complejas, en las que las decisiones de escalado rápidas son esenciales, se benefician enormemente del uso de Karpenter. Se integra y ofrece una mejor AWS optimización de la implementación y la selección de nodos.

Karpenter incluye las siguientes características clave:

Aprovisionamiento dinámico: Karpenter proporciona las instancias y los tamaños correctos para cada propósito y aprovisiona nuevos nodos de forma dinámica en función de los requisitos particulares de los pods.
Programación avanzada: mediante una ubicación inteligente de los módulos, Karpenter organiza los nodos de manera que los recursos como la GPU, la CPU, la memoria y el almacenamiento se utilicen de la forma más eficaz posible.
Escalado rápido: Karpenter puede escalar rápidamente y, con frecuencia, reacciona en cuestión de segundos. Esta capacidad de respuesta es útil para los patrones de tráfico repentino o cuando la carga de trabajo exige un escalado inmediato
Rentabilidad: si elige cuidadosamente la instancia más eficaz, puede reducir los costos operativos y aprovechar las alternativas adicionales de ahorro de costos que ofrecen AWS, como las instancias bajo demanda, las instancias puntuales y las instancias reservadas.

Aviso JavaScript está desactivado o no está disponible en su navegador.

Para utilizar la documentación de AWS, debe estar habilitado JavaScript. Para obtener más información, consulte las páginas de ayuda de su navegador.

Convenciones del documento

Introducción

Escalamiento de la carga