Métricas de Información de contenedores de Kubernetes y de Amazon EKS

En las siguientes tablas, se muestran las métricas y las dimensiones que recopila Información de contenedores para Amazon EKS y Kubernetes. Estas métricas se encuentran en el espacio de nombres ContainerInsights. Para obtener más información, consulte Métricas.

Si no ve ninguna métrica de Información de contenedores en la consola, asegúrese de haber completado la configuración de Información de contenedores. Las métricas no aparecen antes de haber configurado por completo Información de contenedores. Para obtener más información, consulte Configuración de Información de contenedores.

Nombre de métrica	Dimensiones	Descripción
`cluster_failed_node_count`	`ClusterName`	El número de nodos de trabajo con errores en el clúster. Se considera que un nodo ha fallado si está sufriendo de cualquiera de las condiciones de nodo. Para obtener más información, consulte Conditions (Condiciones) en la documentación de Kubernetes.
`cluster_node_count`	`ClusterName`	El número total de nodos de trabajo en el clúster.
`namespace_number_of_running_pods`	`Namespace` `ClusterName` `ClusterName`	El número de pods que se ejecutan por espacio de nombres en el recurso que se especifica mediante las dimensiones que está utilizando.
`node_cpu_limit`	`ClusterName`	El número máximo de unidades de CPU que se pueden asignar a un único nodo en este clúster.
`node_cpu_reserved_capacity`	`NodeName`, `ClusterName`, `InstanceId` `ClusterName`	El porcentaje de unidades de CPU que están reservadas para los componentes de nodos, como kubelet, kube-proxy y Docker. Fórmula: `node_cpu_request / node_cpu_limit` nota `node_cpu_request` no se informa directamente como una métrica, sino que es un campo en el registro de eventos del rendimiento. Para obtener más información, consulte Campos relevantes en eventos de registro de rendimiento para Amazon EKS y Kubernetes.
`node_cpu_usage_total`	`ClusterName`	El número de unidades de CPU que se utilizan en los nodos del clúster.
`node_cpu_utilization`	`NodeName`, `ClusterName`, `InstanceId` `ClusterName`	El porcentaje total de unidades de CPU que se utilizan en los nodos del clúster. Fórmula: `node_cpu_usage_total / node_cpu_limit`
`node_gpu_limit`	`ClusterName` `ClusterName`, `InstanceId`, `NodeName`	El número total de GPU disponibles en el nodo.
`node_gpu_usage_total`	`ClusterName` `ClusterName`, `InstanceId`, `NodeName`	El número de GPU que utilizan los pods en ejecución en el nodo.
`node_gpu_reserved_capacity`	`ClusterName` `ClusterName`, `InstanceId`, `NodeName`	El porcentaje de GPU que se reserva actualmente en el nodo. La fórmula es, `node_gpu_request / node_gpu_limit`. nota `node_gpu_request` no se informa directamente como una métrica, sino que es un campo en el registro de eventos del rendimiento. Para obtener más información, consulte Campos relevantes en eventos de registro de rendimiento para Amazon EKS y Kubernetes.
`node_filesystem_utilization`	`NodeName`, `ClusterName`, `InstanceId` `ClusterName`	El porcentaje total de capacidad de sistema de archivos que se utiliza en los nodos del clúster. Fórmula: `node_filesystem_usage / node_filesystem_capacity` nota `node_filesystem_usage` y `node_filesystem_capacity` no se informan directamente como métricas, sino que son campos en el registro de eventos del rendimiento. Para obtener más información, consulte Campos relevantes en eventos de registro de rendimiento para Amazon EKS y Kubernetes.
`node_memory_limit`	`ClusterName`	La cantidad máxima de memoria, en bytes, que se puede asignar a un único nodo en este clúster.
`node_memory_reserved_capacity`	`NodeName`, `ClusterName`, `InstanceId` `ClusterName`	El porcentaje de memoria que se utiliza actualmente en los nodos del clúster. Fórmula: `node_memory_request / node_memory_limit` nota `node_memory_request` no se informa directamente como una métrica, sino que es un campo en el registro de eventos del rendimiento. Para obtener más información, consulte Campos relevantes en eventos de registro de rendimiento para Amazon EKS y Kubernetes.
`node_memory_utilization`	`NodeName`, `ClusterName`, `InstanceId` `ClusterName`	El porcentaje de memoria que utiliza actualmente el nodo o los nodos. Es el porcentaje de uso de memoria de nodo sobre la limitación de memoria de nodo. Fórmula: `node_memory_working_set / node_memory_limit`.
`node_memory_working_set`	`ClusterName`	La cantidad de memoria, en bytes, que se utiliza en el conjunto de trabajo de los nodos del clúster.
`node_network_total_bytes`	`NodeName`, `ClusterName`, `InstanceId` `ClusterName`	El número total de bytes por segundo transmitidos y recibidos a través de la red por nodo en un clúster. Fórmula: `node_network_rx_bytes + node_network_tx_bytes` nota `node_network_rx_bytes` y `node_network_tx_bytes` no se informan directamente como métricas, sino que son campos en el registro de eventos del rendimiento. Para obtener más información, consulte Campos relevantes en eventos de registro de rendimiento para Amazon EKS y Kubernetes.
`node_number_of_running_containers`	`NodeName`, `ClusterName`, `InstanceId` `ClusterName`	El número de contenedores en ejecución por nodo en un clúster.
`node_number_of_running_pods`	`NodeName`, `ClusterName`, `InstanceId` `ClusterName`	El número de pods en ejecución por nodo en un clúster.
`pod_cpu_reserved_capacity`	`PodName`, `Namespace`, `ClusterName` `ClusterName`	La capacidad de la CPU reservada por pod en un clúster. Fórmula: `pod_cpu_request / node_cpu_limit` nota `pod_cpu_request` no se informa directamente como una métrica, sino que es un campo en el registro de eventos del rendimiento. Para obtener más información, consulte Campos relevantes en eventos de registro de rendimiento para Amazon EKS y Kubernetes.
`pod_cpu_utilization`	`PodName`, `Namespace`, `ClusterName` `Namespace`, `ClusterName` `Service`, `Namespace`, `ClusterName` `ClusterName`	El porcentaje de unidades de CPU que utilizan los pods. Fórmula: `pod_cpu_usage_total / node_cpu_limit`
`pod_cpu_utilization_over_pod_limit`	`PodName`, `Namespace`, `ClusterName` `Namespace`, `ClusterName` `Service`, `Namespace`, `ClusterName` `ClusterName`	El porcentaje de unidades de CPU utilizadas por pods en relación con el límite de pods. Fórmula: `pod_cpu_usage_total / pod_cpu_limit`
`pod_gpu_request`	`ClusterName` `ClusterName`, `Namespace`, `PodName` `ClusterName`, `FullPodName`, `Namespace`, `PodName`	Las solicitudes de la GPU para el pod. Este valor siempre debe ser igual a `pod_gpu_limit`.
`pod_gpu_limit`	`ClusterName` `ClusterName`, `Namespace`, `PodName` `ClusterName`, `FullPodName`, `Namespace`, `PodName`	El número máximo de GPU de un nodo que se pueden asignar al pod de un nodo.
`pod_gpu_usage_total`	`ClusterName` `ClusterName`, `Namespace`, `PodName` `ClusterName`, `FullPodName`, `Namespace`, `PodName`	El número de GPU que se asignan al pod.
`pod_gpu_reserved_capacity`	`ClusterName` `ClusterName`, `Namespace`, `PodName` `ClusterName`, `FullPodName`, `Namespace`, `PodName`	El porcentaje de GPU que se reserva actualmente en el pod. La fórmula es pod_gpu_request/node_gpu_reserved_capacity.
`pod_memory_reserved_capacity`	`PodName`, `Namespace`, `ClusterName` `ClusterName`	El porcentaje de memoria reservada para los pods. Fórmula: `pod_memory_request / node_memory_limit` nota `pod_memory_request` no se informa directamente como una métrica, sino que es un campo en el registro de eventos del rendimiento. Para obtener más información, consulte Campos relevantes en eventos de registro de rendimiento para Amazon EKS y Kubernetes.
`pod_memory_utilization`	`PodName`, `Namespace`, `ClusterName` `Namespace`, `ClusterName` `Service`, `Namespace`, `ClusterName` `ClusterName`	El porcentaje de memoria que utiliza actualmente el pod o los pods. Fórmula: `pod_memory_working_set / node_memory_limit`
`pod_memory_utilization_over_pod_limit`	`PodName`, `Namespace`, `ClusterName` `Namespace`, `ClusterName` `Service`, `Namespace`, `ClusterName` `ClusterName`	El porcentaje de memoria utilizada por los pods en relación con el límite de pods. Si algún contenedor del pod no tiene definido un límite de memoria, esta métrica no aparecerá. Fórmula: `pod_memory_working_set / pod_memory_limit`
`pod_network_rx_bytes`	`PodName`, `Namespace`, `ClusterName` `Namespace`, `ClusterName` `Service`, `Namespace`, `ClusterName` `ClusterName`	El número de bytes por segundo que se están recibiendo a través de la red por el pod. Fórmula: `sum(pod_interface_network_rx_bytes)` nota `pod_interface_network_rx_bytes` no se informa directamente como una métrica, sino que es un campo en el registro de eventos del rendimiento. Para obtener más información, consulte Campos relevantes en eventos de registro de rendimiento para Amazon EKS y Kubernetes.
`pod_network_tx_bytes`	`PodName`, `Namespace`, `ClusterName` `Namespace`, `ClusterName` `Service`, `Namespace`, `ClusterName` `ClusterName`	El número de bytes por segundo que se están transmitiendo a través de la red por el pod. Fórmula: `sum(pod_interface_network_tx_bytes)` nota `pod_interface_network_tx_bytes` no se informa directamente como una métrica, sino que es un campo en el registro de eventos del rendimiento. Para obtener más información, consulte Campos relevantes en eventos de registro de rendimiento para Amazon EKS y Kubernetes.
`pod_number_of_container_restarts`	`PodName`, `Namespace`, `ClusterName`	El número total de reinicios del contenedor en un pod.
`service_number_of_running_pods`	`Service`, `Namespace`, `ClusterName` `ClusterName`	El número de pods que ejecutan el servicio o servicios en el clúster.

Métricas de Kueue

A partir de la versión v2.4.0-eksbuild.1 del complemento de observabilidad de EKS de CloudWatch, Información de contenedores para Amazon EKS admite la recopilación de métricas de Kueue de clústeres de Amazon EKS. Para obtener más información acerca del complemento, consulte Instalación del agente de CloudWatch con el complemento de observabilidad de EKS de Amazon CloudWatch o el gráfico de Helm.

Para obtener más información sobre la habilitación de las métricas, consulte Habilitación de las métricas de Kueue para habilitarlas.

Las métricas de Kueue que se recopilan se enumeran en la siguiente tabla. Estas métricas se publican en el espacio de nombres ContainerInsights/Prometheus de CloudWatch. Algunas de estas métricas utilizan las siguientes dimensiones:

ClusterQueue es el nombre de ClusterQueue
Los valores posibles de Status son active y inadmissible.
Los valores posibles de Reason son Preempted, PodsReadyTimeout, AdmissionCheck, ClusterQueueStopped y InactiveWorkload.
Flavor es la variedad a la que se hace referencia.
Resource hace referencia a los recursos de computación en clústeres, como cpu, memory, gpu, etc.

Nombre de métrica	Dimensiones	Descripción
`kueue_pending_workloads`	`ClusterName`, `ClusterQueue`, `Status` `ClusterName`, `ClusterQueue` `ClusterName`, `Status` `ClusterName`	El número de cargas de trabajo pendientes.
`kueue_evicted_workloads_total`	`ClusterName`, `ClusterQueue`, `Reason` `ClusterName`, `ClusterQueue` `ClusterName`, `Reason` `ClusterName`	El número total de cargas de trabajo expulsadas.
`kueue_admitted_active_workloads`	`ClusterName`, `ClusterQueue` `ClusterName`	El número de cargas de trabajo admitidas que están activas (no suspendidas y no terminadas).
`kueue_cluster_queue_resource_usage`	`ClusterName`, `ClusterQueue`, `Resource`, `Flavor` `ClusterName`, `ClusterQueue`, `Resource` `ClusterName`, `ClusterQueue`, `Flavor` `ClusterName`, `ClusterQueue` `ClusterName`	Indica el uso total de recursos de ClusterQueue.
`kueue_cluster_queue_nominal_quota`	`ClusterName`, `ClusterQueue`, `Resource`, `Flavor` `ClusterName`, `ClusterQueue`, `Resource` `ClusterName`, `ClusterQueue`, `Flavor` `ClusterName`, `ClusterQueue` `ClusterName`	Indica la cuota de recursos de ClusterQueue.

Aviso JavaScript está desactivado o no está disponible en su navegador.

Para utilizar la documentación de AWS, debe estar habilitado JavaScript. Para obtener más información, consulte las páginas de ayuda de su navegador.

Convenciones del documento

Métricas de Amazon EKS e Información de contenedores de Kubernetes con observabilidad mejorada

Referencia de registros de rendimiento

Métricas de Información de contenedores de Kubernetes y de Amazon EKS

nota

nota

nota

nota

nota

nota

nota

nota

nota

Métricas de Kueue