Parametri di Container Insights per Amazon EKS e Kubernetes

Le tabelle seguenti elencano le metriche e le dimensioni raccolte da Container Insights per Amazon EKS e Kubernetes. Tali parametri si trovano nello spazio dei nomi ContainerInsights. Per ulteriori informazioni, consulta la pagina Metriche.

Se nella console non viene visualizzato alcun parametro di Container Insights, assicurati di aver completato la configurazione di Container Insights. I parametri vengono visualizzati solo dopo aver completato la configurazione di Container Insights. Per ulteriori informazioni, consulta Configurazione di Container Insights.

Nome parametro	Dimensioni	Descrizione
`cluster_failed_node_count`	`ClusterName`	Il numero di nodi di lavoro non riusciti nel cluster. Un nodo è considerato non riuscito se risente delle condizioni del nodo. Per ulteriori informazioni, consulta Conditions (Condizioni) nella documentazione Kubernetes.
`cluster_node_count`	`ClusterName`	Il numero totale di nodi di lavoro nel cluster.
`namespace_number_of_running_pods`	`Namespace` `ClusterName` `ClusterName`	Il numero di pod in esecuzione per spazio dei nomi nella risorsa specificata dalle dimensioni in uso.
`node_cpu_limit`	`ClusterName`	Il numero massimo di unità di CPU che può essere assegnato a un singolo nodo nel cluster corrente.
`node_cpu_reserved_capacity`	`NodeName`, `ClusterName`, `InstanceId` `ClusterName`	La percentuale di unità CPU riservate per i componenti del nodo, ad esempio kubelet, kube-proxy e Docker. Formula: `node_cpu_request / node_cpu_limit` Nota `node_cpu_request` non viene riportato direttamente come parametro, ma è un campo nei log eventi delle prestazioni. Per ulteriori informazioni, consulta Campi rilevanti negli eventi di log delle prestazioni per Amazon EKS e Kubernetes.
`node_cpu_usage_total`	`ClusterName`	Il numero di unità di CPU in uso sui nodi del cluster.
`node_cpu_utilization`	`NodeName`, `ClusterName`, `InstanceId` `ClusterName`	La percentuale totale delle unità di CPU in uso sui nodi del cluster. Formula: `node_cpu_usage_total / node_cpu_limit`
`node_gpu_limit`	`ClusterName` `ClusterName`, `InstanceId`, `NodeName`	Il numero totale di GPU disponibili sul nodo.
`node_gpu_usage_total`	`ClusterName` `ClusterName`, `InstanceId`, `NodeName`	Il numero di GPU utilizzate dai pod in esecuzione sul nodo.
`node_gpu_reserved_capacity`	`ClusterName` `ClusterName`, `InstanceId`, `NodeName`	La percentuale di GPU attualmente riservata sul nodo. La formula è,`node_gpu_request / node_gpu_limit`. Nota `node_gpu_request` non viene riportato direttamente come parametro, ma è un campo nei log eventi delle prestazioni. Per ulteriori informazioni, consulta Campi rilevanti negli eventi di log delle prestazioni per Amazon EKS e Kubernetes.
`node_filesystem_utilization`	`NodeName`, `ClusterName`, `InstanceId` `ClusterName`	La percentuale totale della capacità del file system in uso sui nodi del cluster. Formula: `node_filesystem_usage / node_filesystem_capacity` Nota `node_filesystem_usage` e `node_filesystem_capacity` non vengono riportati direttamente come parametri, ma sono campi nei log eventi delle prestazioni. Per ulteriori informazioni, consulta Campi rilevanti negli eventi di log delle prestazioni per Amazon EKS e Kubernetes.
`node_memory_limit`	`ClusterName`	La quantità massima di memoria, espressa in byte, che può essere assegnata a un singolo nodo nel cluster corrente.
`node_memory_reserved_capacity`	`NodeName`, `ClusterName`, `InstanceId` `ClusterName`	La percentuale di memoria attualmente utilizzata sui nodi del cluster. Formula: `node_memory_request / node_memory_limit` Nota `node_memory_request` non viene riportato direttamente come parametro, ma è un campo nei log eventi delle prestazioni. Per ulteriori informazioni, consulta Campi rilevanti negli eventi di log delle prestazioni per Amazon EKS e Kubernetes.
`node_memory_utilization`	`NodeName`, `ClusterName`, `InstanceId` `ClusterName`	La percentuale di memoria attualmente utilizzata dal nodo o dai nodi. È la percentuale di utilizzo della memoria del nodo rispetto alla limitazione di memoria del nodo. Formula: `node_memory_working_set / node_memory_limit`.
`node_memory_working_set`	`ClusterName`	La quantità di memoria, espressa in byte, in uso nel working set dei nodi del cluster.
`node_network_total_bytes`	`NodeName`, `ClusterName`, `InstanceId` `ClusterName`	Il numero totale di byte al secondo trasmessi e ricevuti tramite la rete per nodo in un cluster. Formula: `node_network_rx_bytes + node_network_tx_bytes` Nota `node_network_rx_bytes` e `node_network_tx_bytes` non vengono riportati direttamente come parametri, ma sono campi nei log eventi delle prestazioni. Per ulteriori informazioni, consulta Campi rilevanti negli eventi di log delle prestazioni per Amazon EKS e Kubernetes.
`node_number_of_running_containers`	`NodeName`, `ClusterName`, `InstanceId` `ClusterName`	Il numero di container in esecuzione per nodo in un cluster.
`node_number_of_running_pods`	`NodeName`, `ClusterName`, `InstanceId` `ClusterName`	Il numero di pod in esecuzione per nodo in un cluster.
`pod_cpu_reserved_capacity`	`PodName`, `Namespace`, `ClusterName` `ClusterName`	La capacità della CPU riservata per pod in un cluster. Formula: `pod_cpu_request / node_cpu_limit` Nota `pod_cpu_request` non viene riportato direttamente come parametro, ma è un campo nei log eventi delle prestazioni. Per ulteriori informazioni, consulta Campi rilevanti negli eventi di log delle prestazioni per Amazon EKS e Kubernetes.
`pod_cpu_utilization`	`PodName`, `Namespace`, `ClusterName` `Namespace`, `ClusterName` `Service`, `Namespace`, `ClusterName` `ClusterName`	La percentuale di unità CPU utilizzate dai pod. Formula: `pod_cpu_usage_total / node_cpu_limit`
`pod_cpu_utilization_over_pod_limit`	`PodName`, `Namespace`, `ClusterName` `Namespace`, `ClusterName` `Service`, `Namespace`, `ClusterName` `ClusterName`	La percentuale di unità CPU utilizzata dai pod relativa al limite di pod. Formula: `pod_cpu_usage_total / pod_cpu_limit`
`pod_gpu_request`	`ClusterName` `ClusterName`, `Namespace`, `PodName` `ClusterName`, `FullPodName`, `Namespace`, `PodName`	Le richieste GPU per il pod. Questo valore deve essere sempre uguale a. `pod_gpu_limit`
`pod_gpu_limit`	`ClusterName` `ClusterName`, `Namespace`, `PodName` `ClusterName`, `FullPodName`, `Namespace`, `PodName`	Il numero massimo di GPU che possono essere assegnate al pod in un nodo.
`pod_gpu_usage_total`	`ClusterName` `ClusterName`, `Namespace`, `PodName` `ClusterName`, `FullPodName`, `Namespace`, `PodName`	Il numero di GPU allocate sul pod.
`pod_gpu_reserved_capacity`	`ClusterName` `ClusterName`, `Namespace`, `PodName` `ClusterName`, `FullPodName`, `Namespace`, `PodName`	La percentuale di GPU attualmente riservata al pod. La formula è: pod_gpu_request/node_gpu_reserved_capacity.
`pod_memory_reserved_capacity`	`PodName`, `Namespace`, `ClusterName` `ClusterName`	La percentuale di memoria riservata per i pod. Formula: `pod_memory_request / node_memory_limit` Nota `pod_memory_request` non viene riportato direttamente come parametro, ma è un campo nei log eventi delle prestazioni. Per ulteriori informazioni, consulta Campi rilevanti negli eventi di log delle prestazioni per Amazon EKS e Kubernetes.
`pod_memory_utilization`	`PodName`, `Namespace`, `ClusterName` `Namespace`, `ClusterName` `Service`, `Namespace`, `ClusterName` `ClusterName`	La percentuale di memoria attualmente utilizzata dal pod o dai pod. Formula: `pod_memory_working_set / node_memory_limit`
`pod_memory_utilization_over_pod_limit`	`PodName`, `Namespace`, `ClusterName` `Namespace`, `ClusterName` `Service`, `Namespace`, `ClusterName` `ClusterName`	La percentuale di memoria utilizzata dai pod relativa al limite di pod. Se uno qualsiasi dei container nel pod non ha un limite di memoria definito, questo parametro non viene visualizzato. Formula: `pod_memory_working_set / pod_memory_limit`
`pod_network_rx_bytes`	`PodName`, `Namespace`, `ClusterName` `Namespace`, `ClusterName` `Service`, `Namespace`, `ClusterName` `ClusterName`	Il numero di byte al secondo ricevuti sulla rete dal pod. Formula: `sum(pod_interface_network_rx_bytes)` Nota `pod_interface_network_rx_bytes` non viene riportato direttamente come parametro, ma è un campo nei log eventi delle prestazioni. Per ulteriori informazioni, consulta Campi rilevanti negli eventi di log delle prestazioni per Amazon EKS e Kubernetes.
`pod_network_tx_bytes`	`PodName`, `Namespace`, `ClusterName` `Namespace`, `ClusterName` `Service`, `Namespace`, `ClusterName` `ClusterName`	Il numero di byte al secondo trasmessi sulla rete dal pod. Formula: `sum(pod_interface_network_tx_bytes)` Nota `pod_interface_network_tx_bytes` non viene riportato direttamente come parametro, ma è un campo nei log eventi delle prestazioni. Per ulteriori informazioni, consulta Campi rilevanti negli eventi di log delle prestazioni per Amazon EKS e Kubernetes.
`pod_number_of_container_restarts`	`PodName`, `Namespace`, `ClusterName`	Il numero totale di riavvii del container in un pod.
`service_number_of_running_pods`	`Service`, `Namespace`, `ClusterName` `ClusterName`	Il numero di pod che eseguono il servizio o i servizi nel cluster.

Metriche Kueue

A partire dalla versione v2.4.0-eksbuild.1 del componente aggiuntivo CloudWatch Observability EKS, Container Insights for Amazon EKS supporta la raccolta di metriche Kueue dai cluster Amazon EKS. Per ulteriori informazioni sul componente aggiuntivo, consulta. Installa l' CloudWatch agente con il componente aggiuntivo Amazon CloudWatch Observability EKS o il grafico Helm

Per informazioni sull'attivazione delle metriche, consulta Abilita le metriche Kueue per abilitarle.

Le metriche Kueue raccolte sono elencate nella tabella seguente. Queste metriche vengono pubblicate nel namespace in. ContainerInsights/Prometheus CloudWatch Alcune di queste metriche utilizzano le seguenti dimensioni:

ClusterQueueè il nome del ClusterQueue
I valori possibili di Status sono active e inadmissible
I valori possibili di Reason sono PreemptedPodsReadyTimeout,AdmissionCheck,ClusterQueueStopped, e InactiveWorkload
Flavorè il sapore di riferimento.
Resourcesi riferisce alle risorse informatiche del cluster, ad esempio cpumemory,gpu, e così via.

Nome parametro	Dimensioni	Descrizione
`kueue_pending_workloads`	`ClusterName`, `ClusterQueue`, `Status` `ClusterName`, `ClusterQueue` `ClusterName`, `Status` `ClusterName`	Il numero di carichi di lavoro in sospeso.
`kueue_evicted_workloads_total`	`ClusterName`, `ClusterQueue`, `Reason` `ClusterName`, `ClusterQueue` `ClusterName`, `Reason` `ClusterName`	Il numero totale di carichi di lavoro eliminati.
`kueue_admitted_active_workloads`	`ClusterName`, `ClusterQueue` `ClusterName`	Il numero di carichi di lavoro ammessi attivi (non sospesi e non completati).
`kueue_cluster_queue_resource_usage`	`ClusterName`, `ClusterQueue`, `Resource`, `Flavor` `ClusterName`, `ClusterQueue`, `Resource` `ClusterName`, `ClusterQueue`, `Flavor` `ClusterName`, `ClusterQueue` `ClusterName`	Riporta l'utilizzo totale delle risorse di. ClusterQueue
`kueue_cluster_queue_nominal_quota`	`ClusterName`, `ClusterQueue`, `Resource`, `Flavor` `ClusterName`, `ClusterQueue`, `Resource` `ClusterName`, `ClusterQueue`, `Flavor` `ClusterName`, `ClusterQueue` `ClusterName`	Riporta la quota di risorse di ClusterQueue.

Avvertimento JavaScript è disabilitato o non è disponibile nel tuo browser.

Per usare la documentazione AWS, JavaScript deve essere abilitato. Consulta le pagine della guida del browser per le istruzioni.

Convenzioni dei documenti

Amazon EKS e Kubernetes Container Insights con metriche di osservabilità avanzate

Documentazione di riferimento dei log delle prestazioni

Parametri di Container Insights per Amazon EKS e Kubernetes

Nota

Nota

Nota

Nota

Nota

Nota

Nota

Nota

Nota

Metriche Kueue