Obiettivi del livello di servizio (SLO) - Amazon CloudWatch

Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.

Obiettivi del livello di servizio (SLO)

È possibile utilizzare Application Signals per creare obiettivi del livello di servizio per i servizi destinati alle operazioni aziendali critiche. Creando SLO su questi servizi, sarai in grado di tracciarli sulla dashboard SLO, offrendoti una at-a-glance visione delle tue operazioni più importanti.

Oltre a creare una panoramica che gli operatori possono utilizzare per visualizzare lo stato attuale delle operazioni critiche, puoi utilizzare gli SLO per monitorare le prestazioni a lungo termine dei tuoi servizi, per assicurarti che soddisfino le tue aspettative. Se hai stipulato contratti sul livello di servizio con i clienti, gli SLO sono un ottimo strumento per accertarti che vengano rispettati.

La valutazione dello stato dei servizi con gli SLO inizia con la definizione di obiettivi chiari e misurabili basati su parametri delle prestazioni chiave: gli indicatori del livello di servizio (SLI). Uno SLO tiene traccia delle prestazioni SLI rispetto alla soglia e all'obiettivo prefissati e riporta in che misura le prestazioni delle applicazioni si avvicinano alla soglia.

Application Signals ti aiuta a impostare gli SLO sui parametri delle prestazioni chiave. Application Signals raccoglie automaticamente parametri di Latency e Availability per ogni servizio e operazione che individua e questi parametri sono spesso ideali da utilizzare come SLI. Con la procedura guidata di creazione degli SLO, puoi utilizzare questi parametri per i tuoi SLO. Puoi quindi monitorare lo stato di tutti i tuoi SLO tramite i pannelli di controllo di Application Signals.

Puoi impostare gli SLO su operazioni specifiche che il tuo servizio chiama o utilizza. Puoi utilizzare qualsiasi CloudWatch metrica o espressione metrica come SLI, oltre a utilizzare le metriche and. Latency Availability

La creazione di SLO è molto importante per ottenere il massimo vantaggio da Application Signals. CloudWatch Dopo aver creato gli SLO, puoi visualizzarne lo stato nella console Application Signals per vedere rapidamente quali di questi servizi e operazioni critici stanno funzionando bene e quali no. La possibilità di monitorare gli SLO offre i seguenti principali vantaggi:

  • Gli operatori di servizi vedere più facilmente l'integrità operativa attuale dei servizi critici confrontandoli con lo SLI. In questo modo possono controllare e identificare rapidamente servizi e operazioni non funzionanti.

  • È possibile monitorare le prestazioni dei servizi rispetto a obiettivi aziendali misurabili per periodi di tempo più lunghi.

Scegliendo su cosa impostare gli SLO, dai la priorità a ciò che è importante per te. I pannelli di controllo di Application Signals mostrano automaticamente informazioni su ciò a cui hai dato priorità.

Quando crei uno SLO, puoi anche scegliere di creare CloudWatch allarmi contemporaneamente per monitorare gli SLO. Puoi impostare allarmi per monitorare le violazioni della soglia e anche i livelli di avviso. Questi allarmi possono avvisarti automaticamente se i parametri SLO superano la soglia che hai impostato o se si avvicinano a una soglia di avviso. Ad esempio, uno SLO che si avvicina alla soglia di avviso può avvisarti che il tuo team dovrebbe rallentare la frequenza di abbandono dell'applicazione per assicurarsi che gli obiettivi di prestazione a lungo termine vengano raggiunti.

Concetti di SLO

Uno SLO include i componenti seguenti:

  • Un indicatore del livello di servizio (SLI), che è un parametro chiave delle prestazioni specificato dall'utente. Rappresenta il livello di prestazione desiderato per l'applicazione. Application Signals raccoglie automaticamente parametri chiave di Latency e Availability per i servizi e le operazioni che individua e questi parametri sono spesso ideali da utilizzare come SLI.

    Sei tu a scegliere la soglia da utilizzare per il tuo SLI. Ad esempio, 200 ms per la latenza.

  • Un obiettivo o un obiettivo di raggiungimento, ovvero la percentuale di tempo in cui si prevede che lo SLI raggiunga la soglia in ogni intervallo di tempo. Gli intervalli di tempo possono essere brevi, come ore, o lunghi, come un anno.

    Gli intervalli possono essere intervalli di calendario o intervalli ricorrenti.

    • Gli intervalli del calendario sono allineati al calendario, ad esempio un SLO registrato mensilmente. CloudWatch regola automaticamente i dati relativi a salute, budget e risultati scolastici in base al numero di giorni in un mese. Gli intervalli di calendario sono più adatti agli obiettivi aziendali che sono misurati in base al calendario.

    • Gli intervalli ricorrenti sono calcolati su base sequenziale. Gli intervalli ricorrenti sono più adatti per monitorare l'esperienza utente recente della tua applicazione.

  • Il periodo è un periodo di tempo più breve e più periodi costituiscono un intervallo. Le prestazioni dell'applicazione vengono confrontate allo SLI durante ogni periodo compreso nell'intervallo. Per ogni periodo, si stabilisce che l'applicazione ha raggiunto o non ha raggiunto le prestazioni previste.

Ad esempio, un obiettivo del 99% con un intervallo di calendario di un giorno e un periodo di 1 minuto significa che l'applicazione deve soddisfare o raggiungere la soglia di successo nel 99% dei periodi di 1 minuto durante il giorno. In caso affermativo, lo SLO è stato raggiunto per quel giorno. Il giorno successivo è previsto un nuovo intervallo di valutazione e l'applicazione deve soddisfare o raggiungere la soglia di successo nel 99% dei periodi di 1 minuto durante il secondo giorno per soddisfare lo SLO per il secondo giorno.

Uno SLI può essere basato su uno dei nuovi parametri dell'applicazione standard raccolte da Application Signals. In alternativa, può essere qualsiasi espressione metrica o CloudWatch metrica. I parametri dell'applicazione standard che è possibile utilizzare per una SLI sono Latency e Availability. Availability rappresenta le risposte andate a buon fine divise per il totale delle richieste. Viene calcolata come (1 - frequenza di errore)*100, dove le risposte di errore sono 5xx errori. Le risposte andate a buon fine sono risposte prive di errori 5XX. Le risposte 4XX vengono considerate come andate a buon fine.

Nota

Attualmente sono supportati solo i calcoli basati sul periodo. Il supporto per i calcoli basati su volumi o richieste è previsto per le versioni future.

Calcolo di budget di errore e raggiungimento

Quando si visualizzano le informazioni su uno SLO, vengono visualizzati lo stato di integrità corrente e il relativo budget di errore. Il budget di errore è la quantità di tempo all'interno dell'intervallo che può superare la soglia ma consentire comunque di rispettare lo SLO. Il budget di errore totale è la quantità totale di tempo di superamento della soglia che può essere tollerato durante l'intero intervallo. Il budget di errore residuo è la quantità di tempo residuo di superamento della soglia che può essere tollerato durante l'intervallo corrente. Questo si calcola sottraendo dal budget di errore totale la quantità di tempo in cui la soglia è già stata superata.

L'immagine seguente illustra i concetti di budget di raggiungimento e di errore per un obiettivo con un intervallo di 30 giorni, periodi di 1 minuto e un obiettivo di raggiungimento del 99%. 30 giorni contengono 43.200 periodi da 1 minuto. Il 99% di 43.200 è 42.768, quindi per raggiungere lo SLO è necessario che 42.768 raggiungano l'obiettivo. Finora, nell'intervallo attuale, 130 periodi di 1 minuto non hanno raggiunto l'obiettivo.

Determinazione del successo in ogni periodo

All'interno di ogni periodo, i dati SLI vengono aggregati in un unico punto dati basato sulla statistica utilizzata per lo SLI. Questo punto dati rappresenta l'intera durata del periodo. Quel singolo punto dati viene confrontato con la soglia SLI per determinare se il periodo ha raggiunto l'obiettivo. La visualizzazione nel pannello di controllo dei periodi che non hanno raggiunto l'obiettivo durante l'intervallo di tempo corrente può avvisare gli operatori del servizio che è necessario controllarlo.

Se si ritiene che il periodo non abbia raggiunto l'obiettivo, l'intera durata del periodo viene conteggiata come non riuscito ai fini del calcolo del budget di errore. Il monitoraggio del budget di errore consente di sapere se il servizio sta ottenendo le prestazioni desiderate per un periodo di tempo più lungo.

Creazione di uno SLO.

Ti consigliamo di impostare SLO sia di latenza che di disponibilità sulle tue applicazioni critiche. Questi parametri raccolti da Application Signals sono in linea con gli obiettivi aziendali comuni.

Puoi anche impostare gli SLO su qualsiasi CloudWatch metrica o espressione matematica metrica che risulti in una singola serie temporale.

La prima volta che crei uno SLO nel tuo account, crea CloudWatch automaticamente il ruolo AWSServiceRoleForCloudWatchApplicationSignalscollegato al servizio nel tuo account, se non esiste già. Questo ruolo collegato al servizio consente di CloudWatch raccogliere dati di CloudWatch log, dati di tracciamento a raggi X, dati di CloudWatch metrica e dati di etichettatura dalle applicazioni del tuo account. Per ulteriori informazioni sui ruoli collegati ai servizi, vedere. CloudWatch Utilizzo di ruoli collegati ai servizi per CloudWatch

Creazione di uno SLO
  1. Apri la CloudWatch console all'indirizzo https://console.aws.amazon.com/cloudwatch/.

  2. Nel riquadro di navigazione scegli Obiettivi del livello di servizio (SLO).

  3. Scegli Crea SLO.

  4. Inserisci un nome per lo SLO. L'inclusione del nome di un servizio o di un'operazione, insieme a parole chiave appropriate come latenza o disponibilità, ti aiuterà a identificare rapidamente cosa indica lo stato SLO durante la valutazione.

  5. In Imposta l'indicatore del livello di servizio (SLI), effettua una delle seguenti operazioni:

    • Per impostare lo SLO su uno dei parametri dell'applicazione standard Latency o Availability:

      1. Seleziona Operazione del servizio.

      2. Seleziona il servizio che lo SLO monitorerà.

      3. Seleziona l'operazione che lo SLO monitorerà.

        I menu a discesa Seleziona servizio e Seleziona operazione sono popolati da servizi e operazioni che sono stati attivi nelle ultime 24 ore.

      4. Seleziona Disponibilità o Latenza, quindi imposta la soglia.

    • Per impostare lo SLO su qualsiasi CloudWatch metrica o espressione matematica CloudWatch metrica:

      1. Scegliete Metric. CloudWatch

      2. Scegli Seleziona CloudWatch metrica.

        Viene visualizzata la schermata Seleziona parametro. Utilizza le schede Sfoglia o Query per trovare il parametro desiderato oppure crea un'espressione matematica del parametro.

        Dopo aver selezionato il parametro desiderato, scegli la scheda Parametri nel grafico e seleziona le statistiche e il periodo da utilizzare per lo SLO. Quindi, scegli Seleziona parametro.

        Per informazioni su queste schermate, consulta Rappresentazione grafica di un parametro e Aggiungere un'espressione matematica a un grafico CloudWatch .

      3. Per Imposta condizione, seleziona un operatore di confronto e una soglia per lo SLO da utilizzare come indicatore di successo.

  6. Se hai selezionato Operazione del servizio nel passaggio 5, puoi facoltativamente scegliere Impostazioni aggiuntive e quindi regolare la durata del periodo per questo SLO.

  7. Imposta l'intervallo e l'obiettivo di raggiungimento per lo SLO. Per ulteriori informazioni sugli intervalli e sugli obiettivi di raggiungimento e su come interagiscono tra loro, consulta Concetti di SLO.

  8. (Facoltativo) Imposta uno o più CloudWatch allarmi o una soglia di avviso per lo SLO.

    1. CloudWatch gli allarmi possono utilizzare Amazon SNS per avvisarti in modo proattivo se un'applicazione non è integra in base alle sue prestazioni SLI.

      Per creare un allarme, seleziona una delle caselle di controllo relative agli allarmi e inserisci o crea l'argomento Amazon SNS da utilizzare per le notifiche quando l'allarme entra nello stato ALARM. Per ulteriori informazioni sugli allarmi, consulta. CloudWatch Utilizzo degli CloudWatch allarmi Amazon La creazione di allarmi comporta addebiti. Per ulteriori informazioni sui CloudWatch prezzi, consulta la pagina CloudWatch dei prezzi di Amazon.

    2. Se imposti una soglia di avviso, questa viene visualizzata nelle schermate di Application Signals per aiutarti a identificare gli SLO che rischiano di non essere raggiunti, anche se al momento sono integri.

      Per impostare una soglia di avviso, inserisci il valore della soglia in Soglia di avviso. Quando il budget di errore dello SLO è inferiore alla soglia di avviso, lo SLO viene contrassegnato con un avviso in diverse schermate di Application Signals. Le soglie di avviso vengono visualizzate anche nei grafici del budget di errore. Puoi anche creare un allarme di avviso per lo SLO basato sulla soglia di avviso.

  9. Per aggiungere tag a questo SLO, scegli la scheda Tag, quindi scegli Aggiungi nuovo tag. Con i tag è possibile a gestire, identificare, organizzare, cercare e filtrare le risorse. Per ulteriori informazioni sui tag, consulta Tagging delle risorse AWS.

    Nota

    Se l'applicazione a cui è correlato questo SLO è registrata AWS Service Catalog AppRegistry, puoi utilizzare il awsApplication tag per associare questo SLO a quell'applicazione in cui si riferisce. AppRegistry Per ulteriori informazioni, consulta Cos'è? AppRegistry

  10. Scegli Crea SLO. Se hai scelto anche di creare uno o più allarmi, il nome del pulsante cambia di conseguenza.

Visualizza e valuta lo stato SLO

Puoi visualizzare rapidamente lo stato dei tuoi SLO utilizzando gli obiettivi del livello di servizio o le opzioni Services nella CloudWatch console. La visualizzazione Servizi fornisce una at-a-glance panoramica del rapporto tra i servizi non integri, calcolato in base agli SLO che hai impostato. Per ulteriori informazioni sull'uso dell'opzione Servizi, consulta Monitoraggio dell'integrità operativa delle applicazioni con Application Signals.

La visualizzazione Obiettivi del livello di servizio offre una panoramica macro dell'organizzazione. È possibile visualizzare gli SLO soddisfatti e non soddisfatti nel loro complesso. In questo modo puoi avere un'idea di quanti dei tuoi servizi e delle tue operazioni rispondono alle tue aspettative per periodi di tempo più lunghi, in base agli SLI che hai scelto.

Per visualizzare tutti gli SLO utilizzando la visualizzazione Obiettivi del livello di servizio
  1. Apri la CloudWatch console all'indirizzo https://console.aws.amazon.com/cloudwatch/.

  2. Nel riquadro di navigazione scegli Obiettivi del livello di servizio (SLO).

    Viene visualizzato l'elenco Obiettivi del livello di servizio (SLO).

    Puoi visualizzare rapidamente lo stato attuale degli SLO nella colonna Stato SLI. Per ordinare gli SLO in modo che tutti gli SLO non integri siano in cima all'elenco, scegli la colonna dello stato SLI finché gli SLO non integri non saranno tutti in cima alla lista.

    La tabella dello SLO contiene le colonne predefinite riportate di seguito. Puoi modificare le colonne da visualizzare selezionando l'icona a forma di ingranaggio sopra l'elenco. Per ulteriori informazioni su obiettivi, SLI, raggiungimento e intervalli, consulta Concetti di SLO.

    • Il nome dello SLO.

    • La colonna Obiettivo mostra la percentuale di periodi di ogni intervallo che devono soddisfare correttamente la soglia SLI affinché venga raggiunto l'obiettivo SLO. Mostra anche la durata dell'intervallo per lo SLO.

    • Lo stato SLI indica l'integrità dello stato operativo corrente dell'applicazione. Se un periodo dell'intervallo di tempo attualmente selezionato non era integro per lo SLO, lo stato SLI mostra Non integro.

    • Il raggiungimento finale è il livello di successo raggiunto alla fine dell'intervallo di tempo selezionato. Ordina in base a questa colonna per vedere gli SLO che rischiano maggiormente di non essere rispettati.

    • Il delta di raggiungimento è la differenza nel livello di raggiungimento tra l'inizio e la fine dell'intervallo di tempo selezionato. Un delta negativo indica che il parametro tende verso il basso. Ordina in base a questa colonna per vedere le tendenze più recenti degli SLO.

    • Il budget di errore finale (%) è la percentuale di tempo totale all'interno del periodo in cui è possibile che si verifichino periodi non integri senza impedire che lo SLO sia raggiunto con successo. Se lo si imposta al 5% e lo SLI non è integro nel 5% o meno dei periodi rimanenti dell'intervallo, lo SLO viene comunque raggiunto con successo.

    • Il delta del budget di errore è la differenza nel budget di errore tra l'inizio e la fine dell'intervallo di tempo selezionato. Un delta negativo indica che il parametro tende verso la non riuscita.

    • Il budget di errore finale (tempo) è la quantità di tempo effettivo nell'intervallo che può essere non integro senza impedire che lo SLO sia raggiunto con successo. Ad esempio, se si tratta di 14 minuti, se lo SLI non è integro per meno di 14 minuti durante l'intervallo rimanente, lo SLO verrà comunque raggiunto con successo.

    • Le colonne Servizio, Operazione e Tipo mostrano informazioni sul servizio e sull'operazione per cui è impostato questo SLO.

  3. Per visualizzare i grafici del raggiungimento e del budget di errore per uno SLO, seleziona il pulsante di opzione accanto al nome dello SLO.

    I grafici nella parte superiore della pagina mostrano il raggiungimento dello SLO e lo stato del budget di errore. Viene inoltre visualizzato un grafico sul parametro SLI associato a questo SLO.

  4. Per valutare ulteriormente uno SLO che non soddisfa il suo obiettivo, scegli il nome del servizio o dell'operazione associato a tale SLO. Verrà visualizzata la pagina dei dettagli dove puoi effettuare ulteriori operazioni di valutazione. Per ulteriori informazioni, consulta Visualizza l'attività di servizio dettagliata e lo stato operativo con la pagina dei dettagli del servizio.

  5. Per modificare l'intervallo di tempo dei grafici e delle tabelle sulla pagina, scegli un nuovo intervallo di tempo nella parte superiore dello schermo.

Modifica di uno SLO esistente

Segui questa procedura per modificare uno SLO esistente. Quando modifichi uno SLO, puoi cambiare solo la soglia, l'intervallo, l'obiettivo di raggiungimento e i tag. Per modificare altri aspetti come il servizio, l'operazione o il parametro, crea un nuovo SLO invece di modificarne uno esistente.

La modifica di parte di una configurazione principale dello SLO, come il periodo o la soglia, invalida tutti i dati e le valutazioni precedenti relativi al raggiungimento e all'integrità. Questa operazione elimina e ricrea efficacemente lo SLO.

Nota

Quando modifichi uno SLO, gli allarmi associati non vengono aggiornati automaticamente. Potrebbe essere necessario aggiornare gli allarmi per mantenerli sincronizzati con lo SLO.

Per modificare uno SLO esistente
  1. Apri la CloudWatch console all'indirizzo https://console.aws.amazon.com/cloudwatch/.

  2. Nel riquadro di navigazione scegli Obiettivi del livello di servizio (SLO).

  3. Scegli il pulsante di opzione accanto allo SLO che desideri modificare, quindi scegli Operazioni, Modifica SLO.

  4. Apporta le modifiche desiderate e seleziona Salva modifiche.

Eliminazione di uno SLO

Segui questa procedura per eliminare uno SLO esistente.

Nota

Quando elimini uno SLO, gli allarmi associati non vengono eliminati automaticamente. Dovrai eliminarli tu stesso. Per ulteriori informazioni, consulta Gestione degli allarmi.

Per eliminare uno SLO
  1. Apri la CloudWatch console all'indirizzo https://console.aws.amazon.com/cloudwatch/.

  2. Nel riquadro di navigazione scegli Obiettivi del livello di servizio (SLO).

  3. Scegli il pulsante di opzione accanto allo SLO che desideri modificare, quindi scegli Operazioni, Elimina SLO.

  4. Scegli Conferma.