Seleccione sus preferencias de cookies

Usamos cookies esenciales y herramientas similares que son necesarias para proporcionar nuestro sitio y nuestros servicios. Usamos cookies de rendimiento para recopilar estadísticas anónimas para que podamos entender cómo los clientes usan nuestro sitio y hacer mejoras. Las cookies esenciales no se pueden desactivar, pero puede hacer clic en “Personalizar” o “Rechazar” para rechazar las cookies de rendimiento.

Si está de acuerdo, AWS y los terceros aprobados también utilizarán cookies para proporcionar características útiles del sitio, recordar sus preferencias y mostrar contenido relevante, incluida publicidad relevante. Para aceptar o rechazar todas las cookies no esenciales, haga clic en “Aceptar” o “Rechazar”. Para elegir opciones más detalladas, haga clic en “Personalizar”.

Métricas de Información de contenedores de Kubernetes y de Amazon EKS

Modo de enfoque
Métricas de Información de contenedores de Kubernetes y de Amazon EKS - Amazon CloudWatch

En las siguientes tablas, se muestran las métricas y las dimensiones que recopila Información de contenedores para Amazon EKS y Kubernetes. Estas métricas se encuentran en el espacio de nombres ContainerInsights. Para obtener más información, consulte Métricas.

Si no ve ninguna métrica de Información de contenedores en la consola, asegúrese de haber completado la configuración de Información de contenedores. Las métricas no aparecen antes de haber configurado por completo Información de contenedores. Para obtener más información, consulte Configuración de Información de contenedores.

Nombre de métrica Dimensiones Descripción

cluster_failed_node_count

ClusterName

El número de nodos de trabajo con errores en el clúster. Se considera que un nodo ha fallado si está sufriendo de cualquiera de las condiciones de nodo. Para obtener más información, consulte Conditions (Condiciones) en la documentación de Kubernetes.

cluster_node_count

ClusterName

El número total de nodos de trabajo en el clúster.

namespace_number_of_running_pods

Namespace ClusterName

ClusterName

El número de pods que se ejecutan por espacio de nombres en el recurso que se especifica mediante las dimensiones que está utilizando.

node_cpu_limit

ClusterName

El número máximo de unidades de CPU que se pueden asignar a un único nodo en este clúster.

node_cpu_reserved_capacity

NodeName, ClusterName, InstanceId

ClusterName

El porcentaje de unidades de CPU que están reservadas para los componentes de nodos, como kubelet, kube-proxy y Docker.

Fórmula: node_cpu_request / node_cpu_limit

nota

node_cpu_request no se informa directamente como una métrica, sino que es un campo en el registro de eventos del rendimiento. Para obtener más información, consulte Campos relevantes en eventos de registro de rendimiento para Amazon EKS y Kubernetes.

node_cpu_usage_total

ClusterName

El número de unidades de CPU que se utilizan en los nodos del clúster.

node_cpu_utilization

NodeName, ClusterName, InstanceId

ClusterName

El porcentaje total de unidades de CPU que se utilizan en los nodos del clúster.

Fórmula: node_cpu_usage_total / node_cpu_limit

node_gpu_limit

ClusterName

ClusterName, InstanceId, NodeName

El número total de GPU disponibles en el nodo.

node_gpu_usage_total

ClusterName

ClusterName, InstanceId, NodeName

El número de GPU que utilizan los pods en ejecución en el nodo.

node_gpu_reserved_capacity

ClusterName

ClusterName, InstanceId, NodeName

El porcentaje de GPU que se reserva actualmente en el nodo. La fórmula es, node_gpu_request / node_gpu_limit.

nota

node_gpu_request no se informa directamente como una métrica, sino que es un campo en el registro de eventos del rendimiento. Para obtener más información, consulte Campos relevantes en eventos de registro de rendimiento para Amazon EKS y Kubernetes.

node_filesystem_utilization

NodeName, ClusterName, InstanceId

ClusterName

El porcentaje total de capacidad de sistema de archivos que se utiliza en los nodos del clúster.

Fórmula: node_filesystem_usage / node_filesystem_capacity

nota

node_filesystem_usage y node_filesystem_capacity no se informan directamente como métricas, sino que son campos en el registro de eventos del rendimiento. Para obtener más información, consulte Campos relevantes en eventos de registro de rendimiento para Amazon EKS y Kubernetes.

node_memory_limit

ClusterName

La cantidad máxima de memoria, en bytes, que se puede asignar a un único nodo en este clúster.

node_memory_reserved_capacity

NodeName, ClusterName, InstanceId

ClusterName

El porcentaje de memoria que se utiliza actualmente en los nodos del clúster.

Fórmula: node_memory_request / node_memory_limit

nota

node_memory_request no se informa directamente como una métrica, sino que es un campo en el registro de eventos del rendimiento. Para obtener más información, consulte Campos relevantes en eventos de registro de rendimiento para Amazon EKS y Kubernetes.

node_memory_utilization

NodeName, ClusterName, InstanceId

ClusterName

El porcentaje de memoria que utiliza actualmente el nodo o los nodos. Es el porcentaje de uso de memoria de nodo sobre la limitación de memoria de nodo.

Fórmula: node_memory_working_set / node_memory_limit.

node_memory_working_set

ClusterName

La cantidad de memoria, en bytes, que se utiliza en el conjunto de trabajo de los nodos del clúster.

node_network_total_bytes

NodeName, ClusterName, InstanceId

ClusterName

El número total de bytes por segundo transmitidos y recibidos a través de la red por nodo en un clúster.

Fórmula: node_network_rx_bytes + node_network_tx_bytes

nota

node_network_rx_bytes y node_network_tx_bytes no se informan directamente como métricas, sino que son campos en el registro de eventos del rendimiento. Para obtener más información, consulte Campos relevantes en eventos de registro de rendimiento para Amazon EKS y Kubernetes.

node_number_of_running_containers

NodeName, ClusterName, InstanceId

ClusterName

El número de contenedores en ejecución por nodo en un clúster.

node_number_of_running_pods

NodeName, ClusterName, InstanceId

ClusterName

El número de pods en ejecución por nodo en un clúster.

pod_cpu_reserved_capacity

PodName, Namespace, ClusterName

ClusterName

La capacidad de la CPU reservada por pod en un clúster.

Fórmula: pod_cpu_request / node_cpu_limit

nota

pod_cpu_request no se informa directamente como una métrica, sino que es un campo en el registro de eventos del rendimiento. Para obtener más información, consulte Campos relevantes en eventos de registro de rendimiento para Amazon EKS y Kubernetes.

pod_cpu_utilization

PodName, Namespace, ClusterName

Namespace, ClusterName

Service, Namespace, ClusterName

ClusterName

El porcentaje de unidades de CPU que utilizan los pods.

Fórmula: pod_cpu_usage_total / node_cpu_limit

pod_cpu_utilization_over_pod_limit

PodName, Namespace, ClusterName

Namespace, ClusterName

Service, Namespace, ClusterName

ClusterName

El porcentaje de unidades de CPU utilizadas por pods en relación con el límite de pods.

Fórmula: pod_cpu_usage_total / pod_cpu_limit

pod_gpu_request

ClusterName

ClusterName, Namespace, PodName

ClusterName, FullPodName, Namespace, PodName

Las solicitudes de la GPU para el pod. Este valor siempre debe ser igual a pod_gpu_limit.

pod_gpu_limit

ClusterName

ClusterName, Namespace, PodName

ClusterName, FullPodName, Namespace, PodName

El número máximo de GPU de un nodo que se pueden asignar al pod de un nodo.

pod_gpu_usage_total

ClusterName

ClusterName, Namespace, PodName

ClusterName, FullPodName, Namespace, PodName

El número de GPU que se asignan al pod.

pod_gpu_reserved_capacity

ClusterName

ClusterName, Namespace, PodName

ClusterName, FullPodName, Namespace, PodName

El porcentaje de GPU que se reserva actualmente en el pod. La fórmula es pod_gpu_request/node_gpu_reserved_capacity.

pod_memory_reserved_capacity

PodName, Namespace, ClusterName

ClusterName

El porcentaje de memoria reservada para los pods.

Fórmula: pod_memory_request / node_memory_limit

nota

pod_memory_request no se informa directamente como una métrica, sino que es un campo en el registro de eventos del rendimiento. Para obtener más información, consulte Campos relevantes en eventos de registro de rendimiento para Amazon EKS y Kubernetes.

pod_memory_utilization

PodName, Namespace, ClusterName

Namespace, ClusterName

Service, Namespace, ClusterName

ClusterName

El porcentaje de memoria que utiliza actualmente el pod o los pods.

Fórmula: pod_memory_working_set / node_memory_limit

pod_memory_utilization_over_pod_limit

PodName, Namespace, ClusterName

Namespace, ClusterName

Service, Namespace, ClusterName

ClusterName

El porcentaje de memoria utilizada por los pods en relación con el límite de pods. Si algún contenedor del pod no tiene definido un límite de memoria, esta métrica no aparecerá.

Fórmula: pod_memory_working_set / pod_memory_limit

pod_network_rx_bytes

PodName, Namespace, ClusterName

Namespace, ClusterName

Service, Namespace, ClusterName

ClusterName

El número de bytes por segundo que se están recibiendo a través de la red por el pod.

Fórmula: sum(pod_interface_network_rx_bytes)

nota

pod_interface_network_rx_bytes no se informa directamente como una métrica, sino que es un campo en el registro de eventos del rendimiento. Para obtener más información, consulte Campos relevantes en eventos de registro de rendimiento para Amazon EKS y Kubernetes.

pod_network_tx_bytes

PodName, Namespace, ClusterName

Namespace, ClusterName

Service, Namespace, ClusterName

ClusterName

El número de bytes por segundo que se están transmitiendo a través de la red por el pod.

Fórmula: sum(pod_interface_network_tx_bytes)

nota

pod_interface_network_tx_bytes no se informa directamente como una métrica, sino que es un campo en el registro de eventos del rendimiento. Para obtener más información, consulte Campos relevantes en eventos de registro de rendimiento para Amazon EKS y Kubernetes.

pod_number_of_container_restarts

PodName, Namespace, ClusterName

El número total de reinicios del contenedor en un pod.

service_number_of_running_pods

Service, Namespace, ClusterName

ClusterName

El número de pods que ejecutan el servicio o servicios en el clúster.

Métricas de Kueue

A partir de la versión v2.4.0-eksbuild.1 del complemento de observabilidad de EKS de CloudWatch, Información de contenedores para Amazon EKS admite la recopilación de métricas de Kueue de clústeres de Amazon EKS. Para obtener más información acerca del complemento, consulte Instalación del agente de CloudWatch con el complemento de observabilidad de EKS de Amazon CloudWatch o el gráfico de Helm.

Para obtener más información sobre la habilitación de las métricas, consulte Habilitación de las métricas de Kueue para habilitarlas.

Las métricas de Kueue que se recopilan se enumeran en la siguiente tabla. Estas métricas se publican en el espacio de nombres ContainerInsights/Prometheus de CloudWatch. Algunas de estas métricas utilizan las siguientes dimensiones:

  • ClusterQueue es el nombre de ClusterQueue

  • Los valores posibles de Status son active y inadmissible.

  • Los valores posibles de Reason son Preempted, PodsReadyTimeout, AdmissionCheck, ClusterQueueStopped y InactiveWorkload.

  • Flavor es la variedad a la que se hace referencia.

  • Resource hace referencia a los recursos de computación en clústeres, como cpu, memory, gpu, etc.

Nombre de métrica Dimensiones Descripción

kueue_pending_workloads

ClusterName, ClusterQueue, Status

ClusterName, ClusterQueue

ClusterName, Status

ClusterName

El número de cargas de trabajo pendientes.

kueue_evicted_workloads_total

ClusterName, ClusterQueue, Reason

ClusterName, ClusterQueue

ClusterName, Reason

ClusterName

El número total de cargas de trabajo expulsadas.

kueue_admitted_active_workloads

ClusterName, ClusterQueue

ClusterName

El número de cargas de trabajo admitidas que están activas (no suspendidas y no terminadas).

kueue_cluster_queue_resource_usage

ClusterName, ClusterQueue, Resource, Flavor

ClusterName, ClusterQueue, Resource

ClusterName, ClusterQueue, Flavor

ClusterName, ClusterQueue

ClusterName

Indica el uso total de recursos de ClusterQueue.

kueue_cluster_queue_nominal_quota

ClusterName, ClusterQueue, Resource, Flavor

ClusterName, ClusterQueue, Resource

ClusterName, ClusterQueue, Flavor

ClusterName, ClusterQueue

ClusterName

Indica la cuota de recursos de ClusterQueue.

PrivacidadTérminos del sitioPreferencias de cookies
© 2025, Amazon Web Services, Inc o sus afiliados. Todos los derechos reservados.