Ayude a mejorar esta página
¿Quiere contribuir a esta guía del usuario? Desplácese hasta el final de esta página y seleccione Editar esta página en GitHub. Sus contribuciones ayudarán a que nuestra guía del usuario sea mejor para todos.
Escalado de las implementaciones de pods con Horizontal Pod Autoscaler
El escalador automático de pods horizontales
El Horizontal Pod Autoscaler es un recurso de la API estándar en Kubernetes que simplemente requiere que un origen de métricas (como el servidor de métricas de Kubernetes) esté instalada en el clúster de Amazon EKS para funcionar. No es necesario implementar ni instalar el Horizontal Pod Autoscaler en el clúster para comenzar a escalar las aplicaciones. Para obtener más información, consulte Horizontal Pod Autoscaler en la documentación del Kubernetes.
Utilice este tema para preparar el Horizontal Pod Autoscaler para el clúster de Amazon EKS y para verificar que funciona con una aplicación de muestra.
nota
Este tema se basa en la explicación de Horizontal Pod autoscaler
Requisitos previos
-
Tiene un clúster de Amazon EKS existente. Si no lo tiene, consulte Introducción a Amazon EKS.
-
Tiene instalado el servidor de métricas de Kubernetes. Para obtener más información, consulte Visualización del uso de los recursos con el Metrics Server de Kubernetes.
-
Utiliza un cliente
kubectl
que está configurado para comunicarse con el clúster de Amazon EKS.
Ejecutar una aplicación de prueba del escalador automático de pods horizontales
En esta sección, implementará una aplicación de muestra para verificar que el escalador automático de pods horizontales funciona.
nota
Este ejemplo se basa en la explicación del escalador automático del Pod horizontal
Para probar la instalación del escalador automático de pods horizontales
-
Implemente una aplicación de servidor web Apache sencilla con el siguiente comando.
kubectl apply -f https://k8s.io/examples/application/php-apache.yaml
Este Pod de servidor web Apache tiene un límite de CPU 500 milicpu y sirve en el puerto 80.
-
Cree un recurso del escalador automático de pods horizontales para la implementación de
php-apache
.kubectl autoscale deployment php-apache --cpu-percent=50 --min=1 --max=10
Este comando crea un escalador automático que tiene como objetivo el 50 por ciento de utilización de la CPU para la implementación, con un mínimo de un Pod y un máximo de diez Pods. Cuando la carga media de CPU es inferior al 50 %, el escalador automático intenta reducir el número de Pods en la implementación a un mínimo de uno. Cuando la carga es superior al 50 por ciento, el escalador automático intenta aumentar el número de Pods en la implementación, hasta un máximo de diez. Para obtener más información, consulte How does the HorizontalPodAutoscaler work?
(¿Cómo funciona el escalador automático de pods horizontales?) en la documentación de Kubernetes. -
Describa el escalador automático con el siguiente comando para ver los detalles.
kubectl get hpa
Un ejemplo de salida sería el siguiente.
NAME REFERENCE TARGETS MINPODS MAXPODS REPLICAS AGE php-apache Deployment/php-apache 0%/50% 1 10 1 51s
Como puede ver, la carga actual de la CPU es
0%
, porque todavía no hay carga en el servidor. El recuento de Pod ya se encuentra en su límite más bajo (uno), por lo que no se puede reducir horizontalmente. -
Cree una carga para el servidor web mediante la ejecución un contenedor.
kubectl run -i \ --tty load-generator \ --rm --image=busybox \ --restart=Never \ -- /bin/sh -c "while sleep 0.01; do wget -q -O- http://php-apache; done"
-
Para ver que la implementación escale horizontalmente, ejecute de manera periódica el siguiente comando en un terminal independiente desde el terminal en el que ejecutó el paso anterior.
kubectl get hpa php-apache
Un ejemplo de salida sería el siguiente.
NAME REFERENCE TARGETS MINPODS MAXPODS REPLICAS AGE php-apache Deployment/php-apache 250%/50% 1 10 5 4m44s
El recuento de réplicas puede tardar más de un minuto en aumentar. Mientras el porcentaje actual de la CPU sea superior al porcentaje objetivo, el recuerdo de réplicas aumenta hasta 10. En este caso, es
250%
, para que el número deREPLICAS
siga en aumento.nota
Pueden pasar unos minutos antes de que vea que el recuento de réplicas alcanza su máximo. Si solo se necesitan 6 réplicas, por ejemplo, para que la carga de la CPU permanezca al o por debajo del 50 %, la carga no superará las 6 réplicas.
-
Detenga la carga. En la ventana del terminal en la que genera la carga, mantenga presionadas las teclas
Ctrl+C
para detener la carga. Puede ver cómo las réplicas vuelven a escalar a 1 al ejecutar de nuevo el siguiente comando en el terminal en el que ve la reducción horizontal.kubectl get hpa
Un ejemplo de salida sería el siguiente.
NAME REFERENCE TARGETS MINPODS MAXPODS REPLICAS AGE php-apache Deployment/php-apache 0%/50% 1 10 1 25m
nota
El periodo predeterminado para reducir la escala es de cinco minutos, por lo que pasará algún tiempo antes de que vea que el recuento de réplicas es de 1 de nuevo, incluso cuando el porcentaje actual de la CPU es 0 %. El periodo de tiempo es modificable. Para obtener más información, consulte Horizontal Pod Autoscaler
(Escalador automático de pods horizontales) en la documentación de Kubernetes. -
Cuando haya terminado de experimentar con la aplicación de muestra, elimine los recursos
php-apache
.kubectl delete deployment.apps/php-apache service/php-apache horizontalpodautoscaler.autoscaling/php-apache