En las siguientes tablas, se muestran las métricas y las dimensiones que recopila Información de contenedores para Amazon EKS y Kubernetes. Estas métricas se encuentran en el espacio de nombres ContainerInsights
. Para obtener más información, consulte Métricas.
Si no ve ninguna métrica de Información de contenedores en la consola, asegúrese de haber completado la configuración de Información de contenedores. Las métricas no aparecen antes de haber configurado por completo Información de contenedores. Para obtener más información, consulte Configuración de Información de contenedores.
Nombre de métrica | Dimensiones | Descripción |
---|---|---|
|
|
El número de nodos de trabajo con errores en el clúster. Se considera que un nodo ha fallado si está sufriendo de cualquiera de las condiciones de nodo. Para obtener más información, consulte Conditions |
|
|
El número total de nodos de trabajo en el clúster. |
|
|
El número de pods que se ejecutan por espacio de nombres en el recurso que se especifica mediante las dimensiones que está utilizando. |
|
|
El número máximo de unidades de CPU que se pueden asignar a un único nodo en este clúster. |
|
|
El porcentaje de unidades de CPU que están reservadas para los componentes de nodos, como kubelet, kube-proxy y Docker. Fórmula: nota
|
|
|
El número de unidades de CPU que se utilizan en los nodos del clúster. |
|
|
El porcentaje total de unidades de CPU que se utilizan en los nodos del clúster. Fórmula: |
|
|
El número total de GPU disponibles en el nodo. |
|
|
El número de GPU que utilizan los pods en ejecución en el nodo. |
|
|
El porcentaje de GPU que se reserva actualmente en el nodo. La fórmula es, nota
|
|
|
El porcentaje total de capacidad de sistema de archivos que se utiliza en los nodos del clúster. Fórmula: nota
|
|
|
La cantidad máxima de memoria, en bytes, que se puede asignar a un único nodo en este clúster. |
|
|
El porcentaje de memoria que se utiliza actualmente en los nodos del clúster. Fórmula: nota
|
|
|
El porcentaje de memoria que utiliza actualmente el nodo o los nodos. Es el porcentaje de uso de memoria de nodo sobre la limitación de memoria de nodo. Fórmula: |
|
|
La cantidad de memoria, en bytes, que se utiliza en el conjunto de trabajo de los nodos del clúster. |
|
|
El número total de bytes por segundo transmitidos y recibidos a través de la red por nodo en un clúster. Fórmula: nota
|
|
|
El número de contenedores en ejecución por nodo en un clúster. |
|
|
El número de pods en ejecución por nodo en un clúster. |
|
|
La capacidad de la CPU reservada por pod en un clúster. Fórmula: nota
|
|
|
El porcentaje de unidades de CPU que utilizan los pods. Fórmula: |
|
|
El porcentaje de unidades de CPU utilizadas por pods en relación con el límite de pods. Fórmula: |
|
|
Las solicitudes de la GPU para el pod. Este valor siempre debe ser igual a |
|
|
El número máximo de GPU de un nodo que se pueden asignar al pod de un nodo. |
|
|
El número de GPU que se asignan al pod. |
|
|
El porcentaje de GPU que se reserva actualmente en el pod. La fórmula es pod_gpu_request/node_gpu_reserved_capacity. |
|
|
El porcentaje de memoria reservada para los pods. Fórmula: nota
|
|
|
El porcentaje de memoria que utiliza actualmente el pod o los pods. Fórmula: |
|
|
El porcentaje de memoria utilizada por los pods en relación con el límite de pods. Si algún contenedor del pod no tiene definido un límite de memoria, esta métrica no aparecerá. Fórmula: |
|
|
El número de bytes por segundo que se están recibiendo a través de la red por el pod. Fórmula: nota
|
|
|
El número de bytes por segundo que se están transmitiendo a través de la red por el pod. Fórmula: nota
|
|
|
El número total de reinicios del contenedor en un pod. |
|
|
El número de pods que ejecutan el servicio o servicios en el clúster. |
Métricas de Kueue
A partir de la versión v2.4.0-eksbuild.1
del complemento de observabilidad de EKS de CloudWatch, Información de contenedores para Amazon EKS admite la recopilación de métricas de Kueue de clústeres de Amazon EKS. Para obtener más información acerca del complemento, consulte Instalación del agente de CloudWatch con el complemento de observabilidad de EKS de Amazon CloudWatch o el gráfico de Helm.
Para obtener más información sobre la habilitación de las métricas, consulte Habilitación de las métricas de Kueue para habilitarlas.
Las métricas de Kueue que se recopilan se enumeran en la siguiente tabla. Estas métricas se publican en el espacio de nombres ContainerInsights/Prometheus
de CloudWatch. Algunas de estas métricas utilizan las siguientes dimensiones:
ClusterQueue
es el nombre de ClusterQueueLos valores posibles de
Status
sonactive
yinadmissible
.Los valores posibles de
Reason
sonPreempted
,PodsReadyTimeout
,AdmissionCheck
,ClusterQueueStopped
yInactiveWorkload
.Flavor
es la variedad a la que se hace referencia.Resource
hace referencia a los recursos de computación en clústeres, comocpu
,memory
,gpu
, etc.
Nombre de métrica | Dimensiones | Descripción |
---|---|---|
|
|
El número de cargas de trabajo pendientes. |
|
|
El número total de cargas de trabajo expulsadas. |
|
|
El número de cargas de trabajo admitidas que están activas (no suspendidas y no terminadas). |
|
|
Indica el uso total de recursos de ClusterQueue. |
|
|
Indica la cuota de recursos de ClusterQueue. |