Verifiche dello stato delle istanze - Amazon Elastic Compute Cloud

Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.

Verifiche dello stato delle istanze

Grazie al monitoraggio dello stato delle istanze, puoi determinare rapidamente se Amazon EC2 ha rilevato problemi che potrebbero impedire alle istanze di eseguire le applicazioni. Amazon EC2 esegue i controlli automatici su ogni istanza EC2 in esecuzione per individuare i problemi di hardware e software. Puoi visualizzare i risultati delle verifiche dello stato per individuare problemi specifici e rilevabili. I dati sullo stato degli eventi aumentano le informazioni già fornite da Amazon EC2 sullo stato di ciascuna istanza (ad esempiorunning,stopping,) e i parametri di utilizzo monitorati da CloudWatch Amazon (utilizzo della CPU, traffico di rete e attività del disco). pending

Le verifiche dello stato vengono eseguite ogni minuto e restituiscono un risultato positivo o negativo. Se vengono superate tutte le verifiche, lo stato complessivo dell'istanza sarà OK. Se invece una o più verifiche non vengono superate, lo stato complessivo sarà impaired (danneggiata). Le verifiche dello stato sono integrate in Amazon EC2 in modo tale da non poter essere disattivate o eliminate.

Quando un controllo dello stato fallisce, la CloudWatch metrica corrispondente per i controlli dello stato viene incrementata. Per ulteriori informazioni, consulta Parametri di controllo dello stato. È possibile utilizzare queste metriche per creare CloudWatch allarmi che vengono attivati in base al risultato dei controlli di stato. Ad esempio, puoi creare un allarme che ti avvisi se il risultato delle verifiche dello stato di una specifica istanza è negativo. Per ulteriori informazioni, consulta Creazione e modifica degli allarmi di controllo dello stato.

Puoi anche creare un CloudWatch allarme Amazon che monitora un'istanza Amazon EC2 e ripristina automaticamente l'istanza se viene danneggiata a causa di un problema sottostante. Per ulteriori informazioni, consulta Resilienza dell'istanza.

Tipi di verifica dello stato

Esistono tre tipi di controlli dello stato.

Verifiche dello stato del sistema

I controlli dello stato del sistema monitorano i AWS sistemi su cui viene eseguita l'istanza. Tali verifiche rilevano i problemi sottostanti della tua istanza per la cui risoluzione è richiesto l'intervento di AWS . Quando un controllo dello stato del sistema fallisce, puoi scegliere di attendere AWS la risoluzione del problema oppure puoi risolverlo da solo. Puoi arrestare e avviare manualmente le istanze supportate da Amazon EBS, operazione che nella maggior parte dei casi comporta la migrazione dell'istanza a un nuovo host. Per le istanze Linux supportate dall'instance store, puoi terminare e sostituire l'istanza. Per le istanze di Windows, il volume root deve essere un volume Amazon EBS; l'archivio istanze non è supportato per il volume root. Si noti che i volumi dell'instance store sono effimeri e tutti i dati vengono persi quando l'istanza viene arrestata.

Di seguito sono riportati esempi di problemi che possono causare il mancato superamento delle verifiche dello stato del sistema:

  • Perdita di connettività di rete

  • Perdita di alimentazione elettrica del sistema

  • Problemi di software sull'host fisico

  • Problemi hardware sull'host fisico che incidono sulla raggiungibilità della rete

Se un controllo dello stato del sistema fallisce, incrementiamo la metrica StatusCheckFailed_System.

Istanze Bare Metal

Se esegui un riavvio dal sistema operativo su un'istanza bare metal, il controllo dello stato del sistema potrebbe restituire temporaneamente uno stato di errore. Quando l'istanza diventa disponibile, il controllo dello stato del sistema deve restituire uno stato di riuscita.

Verifiche dello stato delle istanze

Verifiche dello stato delle istanze Monitorano la configurazione del software e della rete della singola istanza. Amazon EC2 verifica lo stato di integrità dell'istanza inviando una richiesta ARP (Address Resolution Protocol) all'interfaccia di rete (NIC). Tali verifiche rilevano i problemi per la cui risoluzione è richiesto il tuo intervento. Se l'esito della verifica dello stato di un'istanza è negativo, solitamente devi risolvere direttamente il problema (ad esempio riavviando l'istanza o modificandone la configurazione).

Nota

Le distribuzioni Linux recenti che utilizzano systemd-networkd per la configurazione di rete potrebbero riportare i controlli di integrità in modo diverso rispetto alle distribuzioni precedenti. Durante il processo di avvio, questo tipo di rete può iniziare prima e potenzialmente terminare prima di altre attività di avvio, che possono influire anche sullo stato dell'istanza. I controlli dello stato che dipendono dalla disponibilità della rete possono segnalare lo stato di integrità prima del completamento di altre attività.

Di seguito sono riportati esempi di problemi che possono causare il mancato superamento delle verifiche dello stato delle istanze:

  • Verifiche dello stato del sistema non riuscite

  • Configurazione errata di rete o startup

  • Memoria esaurita

  • File system danneggiato

  • Kernel non compatibile

  • [Istanze Windows] Durante il riavvio dell'istanza o durante il raggruppamento di un'istanza Windows archiviata, un controllo dello stato dell'istanza segnala un errore fino a quando l'istanza non diventa nuovamente disponibile.

Se il controllo dello stato dell'istanza fallisce, incrementiamo la metrica Failed_Instance. StatusCheck

Istanze Bare Metal

Se esegui un riavvio dal sistema operativo su un'istanza bare metal, il controllo dello stato dell'istanza potrebbe restituire temporaneamente uno stato di errore. Quando l'istanza diventa disponibile, il controllo dello stato dell'istanza deve restituire uno stato di riuscita.

Controlli dello stato dei volumi EBS collegati

I controlli dello stato dei volumi EBS collegati verificano se i volumi Amazon EBS collegati a un'istanza sono raggiungibili e in grado di completare operazioni di I/O. Il parametro StatusCheckFailed_AttachedEBS è un valore binario che segnala un deterioramento nel caso in cui uno o più volumi EBS collegati all'istanza non siano in grado di completare le operazioni di I/O. Questi controlli dello stato rilevano problemi di fondo con l'infrastruttura di calcolo o Amazon EBS. Quando la metrica di controllo dello stato EBS allegata fallisce, puoi attendere AWS la risoluzione del problema oppure puoi intraprendere azioni, come sostituire i volumi interessati o arrestare e riavviare l'istanza.

Di seguito sono riportati esempi di problemi che possono causare il mancato superamento dei controlli dello stato dei volumi EBS collegati:

  • Problemi hardware o software sui sottosistemi di archiviazione alla base dei volumi EBS

  • Problemi hardware sull'host fisico che incidono sulla raggiungibilità dei volumi EBS

  • Problemi di connettività tra l'istanza e i volumi EBS

È possibile utilizzare il parametro StatusCheckFailed_AttachedEBS per migliorare la resilienza di un carico di lavoro. Puoi utilizzare questa metrica per creare CloudWatch allarmi Amazon che vengono attivati in base al risultato del controllo dello stato. Ad esempio, è possibile eseguire il failover su una zona di disponibilità o su un'istanza secondaria quando si rileva un impatto prolungato. In alternativa, puoi monitorare le prestazioni di I/O di ciascun volume collegato utilizzando i CloudWatch parametri EBS per rilevare e sostituire il volume danneggiato. Se il carico di lavoro non determina I/O su nessuno dei volumi EBS collegati all'istanza e il controllo dello stato del volume EBS collegato segnala un problema, è possibile arrestare e avviare l'istanza per risolvere i problemi con l'host fisico che influiscono sulla raggiungibilità dei volumi EBS. Per ulteriori informazioni, consulta i CloudWatch parametri di Amazon per Amazon EBS

Nota

Utilizzo dei controlli dello stato

È possibile utilizzare i controlli dello stato tramite la console e gli strumenti della riga di comando, come AWS CLI.

Visualizzazione dei controlli di stato

Per visualizzare i controlli dello stato, utilizza uno dei metodi seguenti.

Console
Per visualizzare i controlli di stato
  1. Apri la console Amazon EC2 all'indirizzo https://console.aws.amazon.com/ec2/.

  2. Nel riquadro di navigazione, seleziona Instances (Istanze).

  3. Nella pagina Instances (Istanze), la colonna Status check (Verifiche dello stato) elenca lo stato operativo di ogni istanza.

  4. Per visualizzare lo stato di una specifica istanza, seleziona l'istanza, quindi la scheda Stato e allarmi.

    Visualizza le verifiche dello stato dell'istanza nella scheda Stato e allarmi.

    Se l'esito della verifica dello stato di un'istanza è negativo, solitamente devi risolvere direttamente il problema (ad esempio riavviando l'istanza o modificandone la configurazione). Per risolvere gli errori di controllo dello stato del sistema o dell'istanza sulle istanze Linux, consulta. Risolvi i problemi relativi alle istanze Linux con controlli di stato non riusciti

  5. Per esaminare le CloudWatch metriche relative ai controlli dello stato, nella scheda Stato e allarmi, espandi Metriche per visualizzare i grafici relativi alle seguenti metriche:

    • Verifica stato non riuscita per il sistema

    • Verifica stato non riuscita per l'istanza

    Per ulteriori informazioni, consulta Parametri di controllo dello stato.

Command line

È possibile visualizzare le verifiche dello stato delle istanze in esecuzione utilizzando il comando describe-instance-status (AWS CLI).

Per visualizzare lo stato di tutte le istanze, utilizzare il comando seguente:

aws ec2 describe-instance-status

Per ottenere lo stato di tutte le istanze con lo stato di un'istanza di impaired, utilizzare il comando seguente:

aws ec2 describe-instance-status \ --filters Name=instance-status.status,Values=impaired

Per ottenere lo stato di una singola istanza, utilizzare il comando seguente:

aws ec2 describe-instance-status \ --instance-ids i-1234567890abcdef0

In alternativa, utilizzare i comandi seguenti:

Se hai un'istanza Linux con un controllo dello stato non riuscito, consultaRisolvi i problemi relativi alle istanze Linux con controlli di stato non riusciti.

Creazione e modifica degli allarmi di controllo dello stato

Puoi utilizzare le metriche di controllo dello stato per creare CloudWatch allarmi che ti avvisino quando un controllo dello stato di un'istanza non è riuscito.

Importante

Gli allarmi per il controllo dello stato e il controllo dello stato possono temporaneamente entrare in uno stato dei dati insufficiente se mancano dei punti dati metrici. Sebbene raro, ciò può accadere in caso di interruzione dei sistemi di reporting delle metriche, anche quando un'istanza è integra. Ti consigliamo di considerare questo stato come dati mancanti anziché come un errore nel controllo dello stato o una violazione dell'allarme, specialmente quando intraprendi azioni di arresto, interruzione, riavvio o ripristino sull'istanza in risposta.

Per creare un avviso di controllo dello stato, utilizza uno dei metodi seguenti:

Console

Utilizzare la procedura seguente per configurare un allarme che invii una notifica tramite e-mail o che arresti, termini o recuperi un'istanza se la verifica dello stato ha esito negativo.

Per creare un allarme di verifica dello stato
  1. Apri la console Amazon EC2 all'indirizzo https://console.aws.amazon.com/ec2/.

  2. Nel riquadro di navigazione, seleziona Instances (Istanze).

  3. Selezionare l'istanza, scegliere la scheda Status Checks (Verifiche dello stato), quindi Actions (Operazioni), Create status check alarm (Crea un allarme di verifica stato).

  4. Nella pagina Gestisci gli CloudWatch allarmi, in Aggiungi o modifica allarme, scegli Crea un avviso.

  5. Per la Alarm notification (Notifica allarme), attivare l'opzione per configurare le notifiche Amazon Simple Notification Service (Amazon SNS). Selezionare un argomento Amazon SNS esistente o immettere un nome per creare un nuovo argomento.

    Se aggiungi un indirizzo e-mail all'elenco dei destinatari o hai creato un nuovo argomento, Amazon SNS invia un'e-mail di conferma di abbonamento a ogni nuovo indirizzo. Ogni destinatario deve confermare l'abbonamento scegliendo il collegamento contenuto nel messaggio. Le notifiche di avviso vengono inviate solo agli indirizzi confermati.

  6. Per Alarm action (Operazione allarme), attivare l'interruttore per specificare un'azione da eseguire quando viene attivato l'allarme. Selezionare l'azione.

  7. Per Alarm thresholds (Soglie di allarme), selezionare il parametro e i criteri per l'allarme.

    È possibile lasciare le impostazioni di default per Group samples by (Raggruppa campioni per), ossia Average (Media), e per Type of data to sample (Tipo di dati da campionare), ossia Status check failed:either (Controllo stato non riuscito: una delle due voci), oppure modificarle in base alle proprie esigenze.

    In Consecutive period (Periodo consecutivo), impostare il numero di periodi che si desidera valutare e, in Period (Periodo), immettere la durata del periodo di valutazione prima di attivare l'allarme e inviare un'e-mail.

  8. (Facoltativo) Per Sample metric data (Dati dei parametri di esempio), scegliere Add to dashboard (Aggiungi al pannello di controllo).

  9. Scegliere Create (Crea).

Se necessario, puoi apportare delle modifiche a un allarme di stato delle istanze.

Per modificare un allarme di verifica dello stato
  1. Apri la console Amazon EC2 all'indirizzo https://console.aws.amazon.com/ec2/.

  2. Nel riquadro di navigazione, seleziona Istanze.

  3. Seleziona l'istanza e scegli Azioni, Monitoraggio, Gestisci CloudWatch allarmi.

  4. Nella pagina Gestisci gli CloudWatch allarmi, in Aggiungi o modifica allarme, scegli Modifica un avviso.

  5. Per Search for alarm (Cerca allarme), scegli l'allarme da modificare.

  6. Una volta completate le modifiche, scegliere Update (Aggiorna).

Command line

Nell'esempio seguente, l'allarme pubblica una notifica in un argomento SNS, arn:aws:sns:us-west-2:111122223333:my-sns-topic, quando l'istanza non supera la verifica di stato dell'istanza o del sistema per almeno due periodi consecutivi. La CloudWatch metrica utilizzata è. StatusCheckFailed

Per creare un allarme di controllo dello stato utilizzando il AWS CLI
  1. Selezionare un argomento SNS esistente o crearne uno nuovo. Per ulteriori informazioni, consulta Using the AWS CLI with Amazon SNS nella Guida per l'AWS Command Line Interface utente.

  2. Utilizza il seguente comando list-metrics per visualizzare i parametri Amazon disponibili per Amazon CloudWatch EC2.

    aws cloudwatch list-metrics --namespace AWS/EC2
  3. Utilizzare il seguente comando put-metric-alarm per creare l'allarme.

    aws cloudwatch put-metric-alarm \ --alarm-name StatusCheckFailed-Alarm-for-i-1234567890abcdef0 \ --metric-name StatusCheckFailed \ --namespace AWS/EC2 \ --statistic Maximum \ --dimensions Name=InstanceId,Value=i-1234567890abcdef0 \ --unit Count \ --period 300 \ --evaluation-periods 2 \ --threshold 1 \ --comparison-operator GreaterThanOrEqualToThreshold \ --alarm-actions arn:aws:sns:us-west-2:111122223333:my-sns-topic

    Il periodo è l'intervallo di tempo, in secondi, in cui vengono raccolte le CloudWatch metriche di Amazon. Questo esempio utilizza 300, ossia 60 secondi moltiplicati per 5 minuti. Il periodo di valutazione è il numero di periodi consecutivi in cui il valore del parametro deve essere paragonato alla soglia. Questo esempio usa 2. Le operazioni di allarme sono le operazioni da eseguire quando l'allarme viene attivato. Questo esempio configura l'allarme in modo che invii un'e-mail utilizzando Amazon SNS.