Metriche raccolte dall'agente CloudWatch - Amazon CloudWatch

Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.

Metriche raccolte dall'agente CloudWatch

È possibile raccogliere metriche dai server installando l' CloudWatch agente sul server. Puoi installare l'agente sia su EC2 istanze Amazon che su server locali. Puoi anche installare l'agente su computer che eseguono Linux, Windows Server o macOS. Se installi l'agente su un'EC2istanza Amazon, i parametri raccolti dall'agente si aggiungono ai parametri abilitati per impostazione predefinita sulle istanze Amazon. EC2 Per informazioni sull'installazione dell' CloudWatch agente su un'istanza, consulta. Raccogli metriche, log e tracce con l'agente CloudWatch Puoi utilizzare questa sezione per conoscere le metriche raccolte dall' CloudWatch agente.

Metriche raccolte dall' CloudWatch agente sulle istanze di Windows Server

Su un server che esegue Windows Server, l'installazione dell' CloudWatch agente consente di raccogliere le metriche associate ai contatori in Windows Performance Monitor. I nomi delle CloudWatch metriche per questi contatori vengono creati inserendo uno spazio tra il nome dell'oggetto e il nome del contatore. Ad esempio, al contatore % Interrupt Time dell'oggetto Processor viene assegnato il nome parametro Processor % Interrupt Time in CloudWatch. Per ulteriori informazioni sui contatori di Windows Performance Monitor, consulta la documentazione di Microsoft Windows Server.

Lo spazio dei nomi predefinito per le metriche raccolte dall' CloudWatch agente èCWAgent, sebbene sia possibile specificare uno spazio dei nomi diverso quando si configura l'agente.

Metriche raccolte dall' CloudWatchagente sulle istanze Linux e macOS

La tabella seguente elenca le metriche che è possibile raccogliere con l' CloudWatch agente su server Linux e computer macOS.

Parametro Descrizione

cpu_time_active

La quantità di tempo in cui CPU è attivo a qualsiasi titolo. Questo parametro è misurato in centesimi di secondo.

Unità: nessuna

cpu_time_guest

La quantità di tempo in cui CPU viene eseguito un sistema operativo virtuale CPU per un sistema operativo guest. Questo parametro è misurato in centesimi di secondo.

Unità: nessuna

cpu_time_guest_nice

La quantità di tempo CPU impiegata per eseguire un sistema operativo virtuale CPU per un sistema operativo guest, che ha una priorità bassa e può essere interrotta da altri processi. Questo parametro è misurato in centesimi di secondo.

Unità: nessuna

cpu_time_idle

Il periodo di inattivitàCPU. Questo parametro è misurato in centesimi di secondo.

Unità: nessuna

cpu_time_iowait

Il tempo di attesa per CPU il completamento delle operazioni di I/O. Questo parametro è misurato in centesimi di secondo.

Unità: nessuna

cpu_time_irq

La quantità di tempo in cui si verificano le CPU interruzioni di manutenzione. Questo parametro è misurato in centesimi di secondo.

Unità: nessuna

cpu_time_nice

Il periodo di tempo trascorso in modalità utente con processi a bassa priorità, che può essere facilmente interrotto da processi con priorità più alta. CPU Questo parametro è misurato in centesimi di secondo.

Unità: nessuna

cpu_time_softirq

Il periodo di interruzione della manutenzione del softwareCPU. Questo parametro è misurato in centesimi di secondo.

Unità: nessuna

cpu_time_steal

La quantità di tempo impiegato in caso di furto, ossia il CPU tempo impiegato in altri sistemi operativi in un ambiente virtualizzato. Questo parametro è misurato in centesimi di secondo.

Unità: nessuna

cpu_time_system

La quantità di tempo che trascorre in CPU modalità sistema. Questo parametro è misurato in centesimi di secondo.

Unità: nessuna

cpu_time_user

La quantità di tempo in cui CPU è in modalità utente. Questo parametro è misurato in centesimi di secondo.

Unità: nessuna

cpu_usage_active

La percentuale di tempo in cui CPU è attivo a qualsiasi titolo.

Unità: percentuale

cpu_usage_guest

La percentuale di tempo in cui CPU viene eseguito un sistema operativo virtuale CPU per un sistema operativo guest.

Unità: percentuale

cpu_usage_guest_nice

La percentuale di tempo in cui CPU viene eseguito un sistema operativo virtuale CPU per un sistema operativo guest, che ha una priorità bassa e può essere interrotto da altri processi.

Unità: percentuale

cpu_usage_idle

La percentuale di tempo di inattivitàCPU.

Unità: percentuale

cpu_usage_iowait

La percentuale di tempo di attesa per CPU il completamento delle operazioni di I/O.

Unità: percentuale

cpu_usage_irq

La percentuale di interruzioni CPU di manutenzione.

Unità: percentuale

cpu_usage_nice

La percentuale di tempo in cui CPU è in modalità utente con processi a bassa priorità, che i processi con priorità più alta possono interrompere facilmente.

Unità: percentuale

cpu_usage_softirq

La percentuale di interruzioni del software durante CPU la manutenzione.

Unità: percentuale

cpu_usage_steal

Percentuale di tempo impiegato in caso di furto o tempo trascorso in altri sistemi operativi in un ambiente virtualizzato. CPU

Unità: percentuale

cpu_usage_system

La percentuale di tempo in cui CPU è in modalità sistema.

Unità: percentuale

cpu_usage_user

La percentuale di tempo in cui CPU è in modalità utente.

Unità: percentuale

disk_free

Spazio libero sui dischi.

Unità: byte

disk_inodes_free

Il numero di nodi dell'indice disponibili sul disco.

Unità: numero

disk_inodes_total

Il numero totale di nodi dell'indice prenotati sul disco.

Unità: numero

disk_inodes_used

Il numero di nodi dell'indice usati sul disco.

Unità: numero

disk_total

Spazio totale dei dischi, inclusi quelli usati e quelli gratuiti.

Unità: byte

disk_used

Spazio usato sui dischi.

Unità: byte

disk_used_percent

La percentuale di spazio totale del disco usata.

Unità: percentuale

diskio_iops_in_progress

Il numero di richieste di I/O indirizzate al driver del dispositivo, ma che non sono ancora state completate.

Unità: numero

diskio_io_time

La quantità di tempo impiegata dal disco per le richieste di I/O in coda.

Unità: millisecondi

L'unica statistica da utilizzare per questo parametro è Sum. Non usare Average.

diskio_reads

Il numero di operazioni di lettura del disco.

Unità: numero

L'unica statistica da utilizzare per questo parametro è Sum. Non usare Average.

diskio_read_bytes

Il numero di byte letti dai dischi.

Unità: byte

L'unica statistica da utilizzare per questo parametro è Sum. Non usare Average.

diskio_read_time

Il periodo di tempo che le richieste di lettura hanno aspettato su dischi. Varie richieste di lettura in attesa contemporaneamente aumentano il numero. Ad esempio, se tutte e 5 le richieste sono in attesa per una media di 100 millisecondi, ne vengono segnalati 500.

Unità: millisecondi

L'unica statistica da utilizzare per questo parametro è Sum. Non usare Average.

diskio_writes

Il numero di operazioni di scrittura del disco.

Unità: numero

L'unica statistica da utilizzare per questo parametro è Sum. Non usare Average.

diskio_write_bytes

Il numero di byte scritti sui dischi.

Unità: byte

L'unica statistica da utilizzare per questo parametro è Sum. Non usare Average.

diskio_write_time

Il periodo di tempo che le richieste di scrittura hanno aspettato sui dischi. Varie richieste di scrittura in attesa contemporaneamente aumentano il numero. Ad esempio, se tutte e 8 le richieste sono in attesa per una media di 1000 millisecondi, ne vengono segnalati 8000.

Unità: millisecondi

L'unica statistica da utilizzare per questo parametro è Sum. Non usare Average.

ethtool_bw_in_allowance_exceeded

Il numero di pacchetti messi in coda e/o eliminati perché la larghezza di banda aggregata in entrata ha superato il massimo per l'istanza.

Questa metrica viene raccolta solo se è stata elencata nella ethtool sottosezione della sezione del file di configurazione dell'agente. metrics_collected CloudWatch Per ulteriori informazioni, consulta la pagina Raccolta di parametri sulle prestazioni di rete

Unità: nessuna

ethtool_bw_out_allowance_exceeded

Il numero di pacchetti accodati e/o rilasciati perché la larghezza di banda aggregata in uscita ha superato il valore massimo per l'istanza.

Questa metrica viene raccolta solo se è stata elencata nella ethtool sottosezione della sezione del file di configurazione metrics_collected dell' CloudWatch agente. Per ulteriori informazioni, consulta la pagina Raccolta di parametri sulle prestazioni di rete

Unità: nessuna

ethtool_conntrack_allowance_exceeded

Il numero di pacchetti accodati o rilasciati perché il rilevamento delle connessioni ha superato il valore massimo per l'istanza e non è stato possibile stabilire nuove connessioni. Ciò può comportare la perdita di pacchetti per il traffico da o verso l'istanza.

Questa metrica viene raccolta solo se è stata elencata nella ethtool sottosezione della sezione del file di configurazione metrics_collected dell' CloudWatch agente. Per ulteriori informazioni, consulta la pagina Raccolta di parametri sulle prestazioni di rete

Unità: nessuna

ethtool_linklocal_allowance_exceeded

Il numero di pacchetti è stato interrotto perché il PPS traffico verso i servizi proxy locali ha superato il massimo consentito dall'interfaccia di rete. Ciò influisce sul traffico verso il DNS servizio, l'Instance Metadata Service e l'Amazon Time Sync Service.

Questa metrica viene raccolta solo se è stata elencata nella ethtool sottosezione della metrics_collected sezione del file di configurazione dell' CloudWatch agente. Per ulteriori informazioni, consulta la pagina Raccolta di parametri sulle prestazioni di rete

Unità: nessuna

ethtool_pps_allowance_exceeded

Il numero di pacchetti messi in coda e/o eliminati perché il bidirezionale PPS ha superato il massimo per l'istanza.

Questa metrica viene raccolta solo se è stata elencata nella ethtool sottosezione della sezione del file di configurazione dell'agente. metrics_collected CloudWatch Per ulteriori informazioni, consulta Raccolta di parametri sulle prestazioni di rete.

Unità: nessuna

mem_active

La quantità di memoria utilizzata in un modo qualsiasi durante l'ultimo periodo di campionamento.

Unità: byte

mem_available

La quantità di memoria che è disponibile e che può essere immediatamente determinata durante i processi.

Unità: byte

mem_available_percent

La percentuale di memoria che è disponibile e che può essere immediatamente determinata durante i processi.

Unità: percentuale

mem_buffered

La quantità di memoria che viene utilizzata per i buffer.

Unità: byte

mem_cached

La quantità di memoria che viene utilizzata per le cache dei file.

Unità: byte

mem_free

La quantità di memoria che non viene utilizzata.

Unità: byte

mem_inactive

La quantità di memoria non utilizzata in alcun modo durante l'ultimo periodo di campionamento.

Unità: byte

mem_total

La quantità totale di memoria.

Unità: byte

mem_used

La quantità di memoria attualmente in uso.

Unità: byte

mem_used_percent

La percentuale di memoria attualmente in uso.

Unità: percentuale

net_bytes_recv

Il numero di byte ricevuti dall'interfaccia di rete.

Unità: byte

L'unica statistica da utilizzare per questo parametro è Sum. Non usare Average.

net_bytes_sent

Il numero di byte inviati dall'interfaccia di rete.

Unità: byte

L'unica statistica da utilizzare per questo parametro è Sum. Non usare Average.

net_drop_in

Il numero di pacchetti ricevuti da questa interfaccia di rete che sono stati interrotti.

Unità: numero

L'unica statistica da utilizzare per questo parametro è Sum. Non usare Average.

net_drop_out

Il numero di pacchetti trasmessi da questa interfaccia di rete che sono stati interrotti.

Unità: numero

L'unica statistica da utilizzare per questo parametro è Sum. Non usare Average.

net_err_in

Il numero di errori ricevuti rilevati da questa interfaccia di rete.

Unità: numero

L'unica statistica da utilizzare per questo parametro è Sum. Non usare Average.

net_err_out

Il numero di errori trasmessi rilevati da questa interfaccia di rete.

Unità: numero

L'unica statistica da utilizzare per questo parametro è Sum. Non usare Average.

net_packets_sent

Il numero di pacchetti inviati da questa interfaccia di rete.

Unità: numero

L'unica statistica da utilizzare per questo parametro è Sum. Non usare Average.

net_packets_recv

Il numero di pacchetti ricevuti da questa interfaccia di rete.

Unità: numero

L'unica statistica da utilizzare per questo parametro è Sum. Non usare Average.

netstat_tcp_close

Il numero di TCP connessioni senza stato.

Unità: numero

netstat_tcp_close_wait

Il numero di TCP connessioni in attesa di una richiesta di terminazione da parte del client.

Unità: numero

netstat_tcp_closing

Il numero di TCP connessioni in attesa di una richiesta di terminazione con conferma da parte del client.

Unità: numero

netstat_tcp_established

Il numero di connessioni stabilite. TCP

Unità: numero

netstat_tcp_fin_wait1

Il numero di TCP connessioni presenti nello FIN_WAIT1 stato durante il processo di chiusura di una connessione.

Unità: numero

netstat_tcp_fin_wait2

Il numero di TCP connessioni presenti nello FIN_WAIT2 stato durante il processo di chiusura di una connessione.

Unità: numero

netstat_tcp_last_ack

Il numero di TCP connessioni in attesa che il client invii la conferma del messaggio di interruzione della connessione. Questo è l'ultimo stato prima della chiusura della connessione.

Unità: numero

netstat_tcp_listen

Il numero di TCP porte attualmente in attesa di una richiesta di connessione.

Unità: numero

netstat_tcp_none

Il numero di TCP connessioni con client inattivi.

Unità: numero

netstat_tcp_syn_sent

Il numero di TCP connessioni in attesa di una richiesta di connessione corrispondente dopo aver inviato una richiesta di connessione.

Unità: numero

netstat_tcp_syn_recv

Il numero di TCP connessioni in attesa di conferma della richiesta di connessione dopo aver inviato e ricevuto una richiesta di connessione.

Unità: numero

netstat_tcp_time_wait

Il numero di TCP connessioni attualmente in attesa di garantire che il client riceva la conferma della sua richiesta di interruzione della connessione.

Unità: numero

netstat_udp_socket

Il numero di connessioni correnti. UDP

Unità: numero

processes_blocked

Il numero di processi che sono bloccati.

Unità: numero

processes_dead

Il numero di processi "dead", indicati dal codice di stato X su Linux.

Questo parametro non viene raccolto sui computer macOS.

Unità: numero

processes_idle

Il numero di processi che sono inattivi (che sono in stato di sospensione per più di 20 secondi). Disponibile solo nelle BSD istanze gratuite.

Unità: numero

processes_paging

Il numero di processi in fase di paging, indicati dal codice di stato W su Linux.

Questo parametro non viene raccolto sui computer macOS.

Unità: numero

processes_running

Il numero di processi in elaborazione, indicati dal codice di stato R.

Unità: numero

processes_sleeping

Il numero di processi in fase di sospensione, indicati dal codice di stato S.

Unità: numero

processes_stopped

Il numero di processi arrestati, indicati dal codice di stato T.

Unità: numero

processes_total

Il numero totale di processi sull'istanza.

Unità: numero

processes_total_threads

Il numero totale di thread che costituiscono i processi. Questo parametro è disponibile solo per le istanze su Linux.

Questo parametro non viene raccolto sui computer macOS.

Unità: numero

processes_wait

Il numero di processi in fase di paging, indicato dal codice di W stato sulle istanze FreeBSD. Questa metrica è disponibile solo nelle BSD istanze Free e non nelle istanze Linux, Windows Server o macOS.

Unità: numero

processes_zombies

Il numero di processi zombie, indicati dal codice di stato Z.

Unità: numero

swap_free

La quantità di spazio di swapping che non viene usata.

Unità: byte

swap_used

La quantità di spazio di swapping attualmente in uso.

Unità: byte

swap_used_percent

La percentuale di spazio di swapping attualmente in uso.

Unità: percentuale

Definizioni delle metriche di memoria raccolte dall'agente CloudWatch

Quando l' CloudWatch agente raccoglie i parametri di memoria, la fonte è il sottosistema di gestione della memoria dell'host. Ad esempio, il kernel Linux espone i dati gestiti dal sistema operativo in /proc. Per quanto riguarda la memoria, i dati si trovano in /proc/meminfo.

Ogni sistema operativo e architettura diversi prevede calcoli diversi delle risorse utilizzate dai processi. Per ulteriori informazioni, consultare le sezioni indicate di seguito.

Durante ogni intervallo di raccolta, l' CloudWatch agente di ogni istanza raccoglie le risorse dell'istanza e calcola le risorse utilizzate da tutti i processi in esecuzione in quell'istanza. Queste informazioni vengono riportate alle metriche. CloudWatch È possibile configurare la lunghezza dell'intervallo di raccolta nel file di configurazione dell' CloudWatch agente. Per ulteriori informazioni, consulta CloudWatch file di configurazione dell'agente: sezione Agente.

L'elenco seguente spiega come vengono definite le metriche di memoria raccolte dall' CloudWatch agente.

  • Memoria attiva: la memoria utilizzata da un processo. In altre parole, la memoria utilizzata dalle app attualmente in esecuzione.

  • Memoria disponibile: la memoria che può essere assegnata istantaneamente ai processi senza che il sistema vada in swap (nota anche come memoria virtuale).

  • Memoria buffer: l'area dati condivisa da dispositivi hardware o processi di programma che operano a velocità e priorità diverse.

  • Memoria cache: archivia le istruzioni e i dati del programma che vengono utilizzati ripetutamente per il funzionamento dei programmi di cui probabilmente CPU avranno bisogno successivamente.

  • Memoria libera: memoria che non viene utilizzata affatto ed è prontamente disponibile. Il sistema può essere utilizzato in modo completamente gratuito quando necessario.

  • Memoria inattiva: pagine a cui non è stato effettuato l'accesso "di recente".

  • Memoria totale: la dimensione della memoria RAM fisica effettiva.

  • Memoria usata: la memoria attualmente utilizzata da programmi e processi.

Linux: parametri raccolti e calcoli utilizzati

Parametri raccolti e unità:

  • Attivo (byte)

  • Disponibile (byte)

  • Percentuale disponibile (percentuale)

  • Memorizzato nel buffer (byte)

  • Memorizzato nella cache (byte)

  • Gratuito (byte)

  • Attivo (byte)

  • Totale (byte)

  • Utilizzato (byte)

  • Percentuale utilizzata (percentuale)

Memoria utilizzata = Memoria totale - Memoria libera - Memoria cache - Memoria buffer

Memoria totale = Memoria utilizzata + Memoria libera + Memoria cache + Memoria buffer

macOS: parametri raccolti e calcoli utilizzati

Parametri raccolti e unità:

  • Attivo (byte)

  • Disponibile (byte)

  • Percentuale disponibile (percentuale)

  • Gratuito (byte)

  • Attivo (byte)

  • Totale (byte)

  • Utilizzato (byte)

  • Percentuale utilizzata (percentuale)

Memoria disponibile = Memoria libera + Memoria inattiva

Memoria utilizzata = Memoria totale - Memoria disponibile

Memoria totale = Memoria disponibile + Memoria utilizzata

Windows: parametri raccolti

I parametri raccolti sugli host Windows sono riportati di seguito. Tutti questi parametri hanno None per Unit.

  • Byte disponibili

  • Errori di cache/sec

  • Errori di pagina/sec

  • Pagine/sec

Non vengono utilizzati calcoli per le metriche di Windows perché l' CloudWatch agente analizza gli eventi dai contatori delle prestazioni.

Esempio: calcolo dei parametri di memoria su Linux

Ad esempio, supponiamo che l'immissione del comando cat /proc/meminfo su un host Linux mostri i seguenti risultati:

MemTotal: 3824388 kB MemFree: 462704 kB MemAvailable: 2157328 kB Buffers: 126268 kB Cached: 1560520 kB SReclaimable: 289080 kB>

In questo esempio, l' CloudWatch agente raccoglierà i seguenti valori. Tutti i valori che l' CloudWatch agente raccoglie e riporta sono espressi in byte.

  • mem_total: 3916173312 byte

  • mem_available: 2209103872 byte (+ cache) MemFree

  • mem_free: 473808896 byte

  • mem_cached: 1893990400 byte (cached + SReclaimable)

  • mem_used: 1419075584 byte (MemTotal – (MemFree + Buffers + (Cached + SReclaimable)))

  • mem_buffered: 129667072 byte

  • mem_available_percent: 56,41%

  • mem_used_percent: 36,24% (mem_used / mem_total) * 100