Allarmi metrici in Lightsail - Amazon Lightsail

Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.

Allarmi metrici in Lightsail

Puoi creare un allarme in Amazon Lightsail che monitora un'unica metrica per le tue istanze, i database, i sistemi di bilanciamento del carico e le distribuzioni della rete di distribuzione dei contenuti (CDN). L'allarme può essere configurato per inviare notifiche in base al valore del parametro rispetto a una soglia specificata. Le notifiche possono essere un banner visualizzato nella console Lightsail, un messaggio e-mail inviato al tuo indirizzo e-mail e un messaggio SMS inviato al tuo numero di cellulare. In questa guida vengono descritte le condizioni di allarme e le impostazioni che puoi configurare.

Indice

Configurazione di un allarme

Per aggiungere un allarme nella console Lightsail, accedi alla scheda Metriche della tua istanza, database, sistema di bilanciamento del carico o distribuzione CDN. Quindi scegli il parametro da monitorare e seleziona Add alarm (Aggiungi allarme). Puoi aggiungere due allarmi per parametro. Per ulteriori informazioni sui parametri, consulta Parametri delle risorse.

Per configurare l'allarme, identifica innanzitutto un valore di soglia, ovvero il valore del parametro a partire dal quale gli stati dell'allarme cambiano (ad esempio, si passa da uno stato OK a uno stato ALARM o viceversa). Per ulteriori informazioni, consulta Stati degli allarmi. Seleziona quindi un operatore di confronto che verrà utilizzato per confrontare il parametro con la soglia. Gli operatori disponibili sono greater than or equal to (maggiore o uguale a), greater than (maggiore di), less than (minore di) e less than or equal to (minore o uguale a).

Si specifica quindi il numero di volte in cui la soglia deve essere superata e il periodo di tempo in cui il parametro verrà valutato, affinché l'allarme cambi stato. Lightsail valuta i punti dati per gli allarmi ogni 5 minuti e ogni punto dati rappresenta un periodo di 5 minuti di dati aggregati. Ad esempio, se specifichi che l'allarme venga attivato quando la soglia viene attraversata 2 volte, il periodo di valutazione deve essere negli ultimi 10 minuti o superiore (fino a 24 ore). Se specifichi che l'allarme venga attivato quando la soglia viene attraversata 10 volte, il periodo di valutazione deve essere negli ultimi 50 minuti o superiore (fino a 24 ore).

Dopo aver configurato le condizioni per l'allarme, puoi configurare la modalità di ricezione delle notifiche. I banner di notifica vengono sempre visualizzati nella console Lightsail quando l'allarme cambia da OK uno stato all'altro. ALARM Puoi anche scegliere di ricevere notifiche tramite messaggi SMS ed e-mail, ma devi configurare i contatti di notifica a questo scopo. Per ulteriori informazioni, consulta Notifiche dei parametri. Se scegli di ricevere notifiche tramite messaggio SMS e/o e-mail, puoi anche scegliere di riceverle quando lo stato dell'allarme cambia da ALARM a OK, che è considerato come una notifica cancella tutto .

Nelle impostazioni avanzate per l'allarme, puoi scegliere in che modo Lightsail tratta i dati metrici mancanti. Per ulteriori informazioni, consulta Configurazione della modalità in cui gli allarmi trattano i dati mancanti.

Stati degli allarmi

Un allarme si trova sempre in uno dei seguenti stati:

  • ALARM: il parametro non rientra nella soglia definita.

    Ad esempio, se si sceglie un operatore di confronto greater than (maggiore di), lo stato dell'allarme sarà ALARM quando il parametro è superiore alla soglia specificata. Se si sceglie un operatore di confronto less than (minore di), lo stato dell'allarme sarà ALARM quando il parametro è inferiore alla soglia specificata.

  • OK: il parametro rientra nella soglia definita.

    Ad esempio, se si sceglie un operatore di confronto greater than (maggiore di), lo stato dell'allarme sarà OK quando il parametro è inferiore alla soglia specificata. Se si sceglie un operatore di confronto less than (minore di), lo stato dell'allarme sarà OK quando il parametro è superiore alla soglia specificata.

  • INSUFFICIENT_DATA: l'allarme è appena stato attivato, il parametro non è disponibile o la quantità di dati del parametro non è sufficiente per determinare lo stato dell'allarme.

Gli allarmi vengono attivati solo per cambiamenti di stato. Gli allarmi non vengono attivati semplicemente perché sono in uno stato particolare, lo stato deve essere cambiato. Quando viene attivato un allarme, viene visualizzato un banner nella console Lightsail. Puoi anche configurare gli allarmi per inviare una notifica tramite messaggio SMS ed e-mail.

Esempio di allarme

Tenendo presente le condizioni di allarme descritte in precedenza, puoi configurare un allarme che passa in uno stato ALARM quando l'utilizzo CPU di un'istanza è uguale o maggiore del 5% una volta in un singolo periodo di 5 minuti. L'esempio seguente mostra le impostazioni di questo allarme nella console Lightsail.

Esempio di un allarme di utilizzo CPU.

In questo esempio, se il parametro di utilizzo CPU dell'istanza segnala un utilizzo uguale o superiore al 5% in un solo punto dati, lo stato dell'allarme cambia da OK ad ALARM. Per ogni punto dati successivo segnalato per cui l'utilizzo è uguale o superiore al 5%, lo stato dell'allarme viene mantenuto ad ALARM. Quando il parametro di utilizzo CPU dell'istanza segnala un utilizzo uguale o inferiore al 4,9% in un solo punto dati, lo stato dell'allarme cambia da ALARM a OK.

Il grafico seguente illustra ulteriormente questo allarme. La linea rossa tratteggiata rappresenta la soglia di utilizzo CPU del 5% e i punti blu rappresentano punti dati del parametro. Lo stato dell'allarme è OK per il primo punto dati. Il secondo punto dati cambia lo stato dell'allarme in ALARM perché il punto dati è superiore alla soglia. Il terzo e il quarto punto dati mantengono lo stato ALARM, perché i punti dati continuano ad essere superiori alla soglia. Il quinto punto dati cambia lo stato dell'allarme in OK perché il punto dati è inferiore alla soglia.

Esempio di parametro di allarme.

Configurazione della modalità in cui gli allarmi trattano i dati mancanti

In alcuni casi, alcuni punti dati per un parametro con un allarme non vengono segnalati. Ad esempio, ciò può accadere quando una connessione viene persa o in caso di inattività di un server.

Lightsail consente di specificare come trattare i punti dati mancanti durante la configurazione di un allarme. Ciò permette di configurare il passaggio dell'allarme allo stato ALARM quando richiesto per il tipo di dati monitorati. È possibile evitare falsi positivi quando i dati mancanti non indicano un problema.

Così come ogni allarme si trova sempre in uno dei tre stati, ogni punto dati specifico segnalato rientra in una di queste tre categorie:

  • Not breaching: il punto dati si trova entro la soglia.

    Ad esempio, se si sceglie un operatore di confronto greater than (maggiore di), il punto dati sarà Not breaching quando è inferiore alla soglia specificata. Se si sceglie un operatore di confronto less than (minore di), il punto dati sarà Not breaching quando è superiore alla soglia specificata.

  • Breaching: il punto dati si trova oltre la soglia.

    Ad esempio, se si sceglie un operatore di confronto greater than (maggiore di), il punto dati sarà Breaching quando è superiore alla soglia specificata. Se si sceglie un operatore di confronto less than (minore di), il punto dati sarà Breaching quando è inferiore alla soglia specificata.

  • Missing: il comportamento per i punti dati mancanti è specificato dal parametro treat missing data.

Per ogni allarme, puoi specificare che Lightsail gestisca i punti dati mancanti in uno dei seguenti modi:

  • Not breaching: i punti dati mancanti vengono trattati come se fossero "corretti" e all'interno della soglia.

  • Breaching: i punti dati mancanti vengono trattati come se fossero "errati" e superassero la soglia.

  • Ignore: lo stato attuale dell'allarme viene mantenuto.

  • Missing: l'allarme non considera i punti dati mancanti quando valuta se cambiare lo stato. Questo è il comportamento predefinito per gli allarmi.

La scelta migliore dipende dal tipo di parametro. Per un parametro, ad esempio l'utilizzo CPU di un'istanza, potrebbe essere necessario trattare i punti dati mancanti come un superamento soglia. Questo perché i punti dati mancanti potrebbero indicare che si è verificato un problema. Tuttavia, per un parametro che genera punti dati solo quando si verifica un errore, ad esempio il conteggio errori del server HTTP 500 del sistema di bilanciamento del carico, potrebbe essere necessario trattare i dati mancanti come un non superamento soglia.

La scelta dell'opzione migliore per l'allarme evita modifiche dello stato dell'allarme inutili e fuorvianti. Inoltre, indica in maniera più accurata lo stato del sistema.

Come viene valutato lo stato dell'allarme quando mancano i dati

Indipendentemente dal valore impostato per il trattamento dei dati mancanti, quando un allarme valuta se cambiare stato, Lightsail tenta di recuperare un numero maggiore di punti dati rispetto a quello specificato dai periodi di valutazione. Il numero esatto di punti dati che tenta di recuperare dipende dalla durata del periodo di allarme. L'intervallo di tempo dei punti dati che tenta di recuperare è l'intervallo di valutazione.

Dopo che Lightsail ha recuperato questi punti dati, si verifica quanto segue:

  • Se non mancano punti dati nell'intervallo di valutazione, Lightsail valuta l'allarme in base ai punti dati più recenti raccolti.

  • Se mancano alcuni punti dati nell'intervallo di valutazione, ma il numero di punti dati esistenti raccolti è uguale o superiore ai periodi di valutazione dell'allarme, Lightsail valuta lo stato dell'allarme in base ai punti dati esistenti più recenti che sono stati raccolti con successo. In questo caso, il valore impostato per la modalità di gestione dei dati mancanti non è necessario e viene quindi ignorato.

  • Se mancano alcuni punti dati nell'intervallo di valutazione e il numero di punti dati esistenti raccolti è inferiore al numero di periodi di valutazione dell'allarme, Lightsail inserisce i punti dati mancanti con il risultato specificato per il trattamento dei dati mancanti, quindi valuta l'allarme. Tuttavia, i punti di dati reali nel range di valutazione, a prescindere dal momento in cui sono stati rilevati, sono inclusi nella valutazione. Lightsail utilizza i punti dati mancanti solo il minor numero di volte possibile.

In tutte queste situazioni, il numero di punti dati valutato è uguale al valore di Evaluation periods (Periodi di valutazione). Se un numero inferiore rispetto al valore indicato in Data points to Alarm (Punti di dati all'allarme) superano la soglia, lo stato dell'allarme è impostato su OK. In caso contrario, lo stato è impostato su ALARM.

Nota

Un caso particolare di questo comportamento è che gli allarmi Lightsail potrebbero rivalutare ripetutamente l'ultimo set di punti dati per un periodo di tempo dopo che la metrica ha smesso di scorrere. Questa rivalutazione può comportare la modifica dello stato dell'allarme e una nuova esecuzione delle operazioni, se lo stato fosse stato modificato immediatamente prima dell'arresto del flusso del parametro. Per mitigare questo comportamento, utilizzare periodi più brevi.

Dati mancanti negli esempi rappresentati nel grafico

I grafici riportati di seguito in questa sezione illustrano esempi di comportamento di valutazione dell'allarme. Nei grafici A, B, C, D ed E, i punti dati numerici che devono superare la soglia per generare un allarme e i periodi di valutazione sono entrambi pari a 3. La linea rossa tratteggiata rappresenta la soglia, i punti blu rappresentano punti dati validi e i trattini rappresentano dati mancanti. I punti dati al di sopra della linea di soglia determinano un superamento e i punti dati al di sotto della soglia non determinano un superamento. Nel caso in cui manchino alcuni dei tre punti dati più recenti, Lightsail tenterà di recuperare punti dati validi aggiuntivi.

Nota

Se i punti dati mancano subito dopo aver creato un allarme e la metrica veniva segnalata a Lightsail prima di creare l'allarme, Lightsail recupera i punti dati più recenti da prima della creazione dell'allarme durante la valutazione dell'allarme.

Grafico A

Dati mancanti - Grafico A.

Nel precedente parametro rappresentato nel grafico, il punto dati 1 rientra nella soglia, il punto dati 2 risulta mancante, il punto dati 3 supera la soglia, il punto dati 4 risulta mancante e il punto dati 5 supera la soglia. Poiché ci sono tre punti dati validi nell'intervallo di valutazione, questo parametro ha zero punti dati mancanti. Se un allarme è stato configurato per trattare i punti dati mancanti come:

  • Not breaching: l'allarme si troverebbe nello stato OK.

  • Breaching: l'allarme si troverebbe nello stato OK.

  • Ignore: l'allarme si troverebbe nello stato OK.

  • Missing: l'allarme si troverebbe nello stato OK.

Grafico B

Dati mancanti - Grafico B.

Nel precedente parametro rappresentato nel grafico, il punto dati 1 rientra nella soglia e i punti dati da 2 a 5 risultano mancanti. Poiché c'è un solo punto dati nell'intervallo di valutazione, questo parametro ha due punti dati mancanti. Se un allarme è stato configurato per trattare i punti dati mancanti come:

  • Not breaching: l'allarme si troverebbe nello stato OK.

  • Breaching: l'allarme si troverebbe nello stato OK.

  • Ignore: l'allarme si troverebbe nello stato OK.

  • Missing: l'allarme si troverebbe nello stato OK.

In questo scenario, l'allarme rimarrà in uno stato OK, anche se i dati mancanti vengono trattati come superamento soglia. Questo perché l'unico punto dati esistente non supera la soglia e questo viene valutato insieme a due punti dati mancanti che vengono trattati come un superamento soglia. La prossima volta che questo allarme viene valutato, se i dati risultano ancora mancanti il suo stato passa ad ALARM. Questo perché il punto dati che non supera la soglia non è più tra i cinque punti dati più recenti recuperati.

Grafico C

Dati mancanti - Grafico C.

Tutti i punti dati risultano mancanti nel parametro rappresentato nel grafico in precedenza. Poiché tutti i punti dati risultano mancanti nell'intervallo di valutazione, questo parametro ha tre punti dati mancanti. Se un allarme è stato configurato per trattare i punti dati mancanti come:

  • Not breaching: l'allarme si troverebbe nello stato OK.

  • Breaching: l'allarme si troverebbe nello stato ALARM.

  • Ignore: l'allarme manterrebbe lo stato corrente.

  • Missing: l'allarme sarebbe nello stato INSUFFIENT_DATA.

Grafico D

Dati mancanti - Grafico D.

Nel precedente parametro rappresentato nel grafico, il punto dati 1 rientra nella soglia, il punto dati 2 supera la soglia, il punto dati 3 supera la soglia, il punto dati 4 risulta mancante e il punto dati 5 supera la soglia. Poiché sono presenti quattro punti dati validi nell'intervallo di valutazione, questo parametro ha zero punti dati mancanti. Se un allarme è stato configurato per trattare i punti dati mancanti come:

  • Not breaching: l'allarme si troverebbe nello stato ALARM.

  • Breaching: l'allarme si troverebbe nello stato ALARM.

  • Ignore: l'allarme si troverebbe nello stato ALARM.

  • Missing: l'allarme si troverebbe nello stato ALARM.

In questo scenario, lo stato dell'allarme passa nello stato ALLARME in tutti i casi. Questo perché è disponibile un numero di punti dati reali tale che l'impostazione della gestione dei dati mancanti non è necessaria e viene pertanto ignorata.

Grafico E

Dati mancanti - Grafico E.

Nel precedente parametro rappresentato nel grafico, i punti dati 1 e 2 risultano mancanti, il punto dati 3 supera la soglia e i punti dati 4 e 5 risultano mancanti. Poiché c'è un solo punto dati nell'intervallo di valutazione, questo parametro ha due punti dati mancanti. Se un allarme è stato configurato per trattare i punti dati mancanti come:

  • Not breaching: l'allarme si troverebbe nello stato OK.

  • Breaching: l'allarme si troverebbe nello stato ALARM.

  • Ignore: l'allarme manterrebbe lo stato corrente.

  • Missing: l'allarme si troverebbe nello stato ALARM.

Nei grafici F, G, H, I e J, Datapoints to alarm (Punti di dati all'allarme) è impostato su 2, mentre Evaluation periods (Periodi di valutazione) è impostato su 3. Questo è un allarme 2 su 3, M di N. 5 è l'intervallo di valutazione per l'allarme.

Grafico F

Dati mancanti - Grafico F.

Nel precedente parametro rappresentato nel grafico, il punto dati 1 rientra nella soglia, il punto dati 2 risulta mancante, il punto dati 3 supera la soglia, il punto dati 4 risulta mancante e il punto dati 5 supera la soglia. Poiché sono presenti tre punti dati nell'intervallo di valutazione, questo parametro ha zero punti dati mancanti. Se un allarme è stato configurato per trattare i punti dati mancanti come:

  • Not breaching: l'allarme si troverebbe nello stato ALARM.

  • Breaching: l'allarme si troverebbe nello stato ALARM.

  • Ignore: l'allarme si troverebbe nello stato ALARM.

  • Missing: l'allarme si troverebbe nello stato ALARM.

Grafico G

Dati mancanti - Grafico G.

Nel precedente parametro rappresentato nel grafico, i punti dati 1 e 2 rientrano nella soglia, il punto dati 3 supera la soglia, il punto dati 4 rientra nella soglia e il punto dati 5 supera la soglia. Poiché sono presenti cinque punti dati nell'intervallo di valutazione, questo parametro ha zero punti dati mancanti. Se un allarme è stato configurato per trattare i punti dati mancanti come:

  • Not breaching: l'allarme si troverebbe nello stato ALARM.

  • Breaching: l'allarme si troverebbe nello stato ALARM.

  • Ignore: l'allarme si troverebbe nello stato ALARM.

  • Missing: l'allarme si troverebbe nello stato ALARM.

Grafico H

Dati mancanti - Grafico H.

Nel precedente parametro rappresentato nel grafico, il punto dati 1 rientra nella soglia, il punto dati 2 risulta mancante, il punto dati 3 supera la soglia e i punti dati 4 e 5 risultano mancanti. Poiché sono presenti due punti dati nell'intervallo di valutazione, questo parametro ha un punto dati mancante. Se un allarme è stato configurato per trattare i punti dati mancanti come:

  • Not breaching: l'allarme si troverebbe nello stato OK.

  • Breaching: l'allarme si troverebbe nello stato ALARM.

  • Ignore: l'allarme si troverebbe nello stato OK.

  • Missing: l'allarme si troverebbe nello stato OK.

Grafico I

Dati mancanti - Grafico I.

Nel precedente parametro rappresentato nel grafico, i punti dati da 1 a 4 superano la soglia e il punto dati 5 rientra nella soglia. Poiché è presente un punto dati nell'intervallo di valutazione, questo parametro ha due punti dati mancanti. Se un allarme è stato configurato per trattare i punti dati mancanti come:

  • Not breaching: l'allarme si troverebbe nello stato OK.

  • Breaching: l'allarme si troverebbe nello stato ALARM.

  • Ignore: l'allarme si troverebbe nello stato OK.

  • Missing: l'allarme si troverebbe nello stato OK.

Grafico J

Dati mancanti - Grafico J.

Nel precedente parametro rappresentato nel grafico, i punti dati 1 e 2 risultano mancanti, il punto dati 3 supera la soglia e i punti dati 4 e 5 risultano mancanti. Poiché è presente un punto dati nell'intervallo di valutazione, questo parametro ha due punti dati mancanti. Se un allarme è stato configurato per trattare i punti dati mancanti come:

  • Not breaching: l'allarme si troverebbe nello stato OK.

  • Breaching: l'allarme si troverebbe nello stato ALARM.

  • Ignore: l'allarme manterrebbe lo stato corrente.

  • Missing: l'allarme si troverebbe nello stato ALARM.

Ulteriori informazioni sugli allarmi

Ecco alcuni articoli per aiutarti a gestire gli allarmi in Lightsail: