Surveillance automatique et surveillance manuelle - Amazon Elastic Compute Cloud

Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.

Surveillance automatique et surveillance manuelle

AWS fournit différents outils que vous pouvez utiliser pour surveiller Amazon EC2. Vous pouvez configurer certains outils pour qu’ils effectuent la supervision automatiquement, tandis que d’autres nécessitent une intervention manuelle.

Outils de surveillance automatique

Vous pouvez utiliser les outils de surveillance automatique pour surveiller Amazon EC2 et être informé en cas de problème :

  • Contrôles de l'état du système : surveillez les AWS systèmes requis pour utiliser votre instance afin de vous assurer qu'ils fonctionnent correctement. Ces vérifications détectent les problèmes liés à votre instance qui nécessitent une AWS intervention pour les réparer. Lorsqu’un contrôle de statut échoue, vous pouvez choisir d’attendre qu’ AWS résolve le problème ou le résoudre vous-même (par exemple, en arrêtant et en redémarrant une instance, ou en y mettant fin et en la remplaçant). Voici quelques exemples de problèmes entraînant l’échec des contrôles de statut du système :

    • Perte de connectivité réseau

    • Perte d’alimentation système

    • Problèmes logiciels sur un hôte physique

    • Problèmes matériels sur un hôte physique ayant un impact sur l’accessibilité du réseau

    Pour plus d’informations, veuillez consulter Contrôles de statut pour vos instances.

  • Contrôles du statut de l’instance – Surveillez la configuration logicielle et réseau de votre instance. Ces contrôles détectent les problèmes nécessitant votre intervention pour les résoudre. Lorsqu’un contrôle du statut de l’instance échoue, vous devez généralement résoudre le problème vous-même (en redémarrant par exemple l’instance ou en apportant des modifications à votre système d’exploitation). Voici quelques exemples de problèmes susceptibles d’entraîner l’échec des contrôles du statut de l’instance :

    • Échec de contrôles de statut de système

    • Configuration de mise en réseau ou de démarrage incorrecte

    • Mémoire épuisée

    • Système de fichiers corrompu

    • Noyau incompatible

    Pour plus d’informations, consultez Contrôles de statut pour vos instances.

  • CloudWatch Alarmes Amazon : surveillez une seule métrique sur une période que vous spécifiez et effectuez une ou plusieurs actions en fonction de la valeur de la métrique par rapport à un seuil donné sur un certain nombre de périodes. L’action est une notification envoyée à une rubrique Amazon Simple Notification Service (Amazon SNS) ou une politique Amazon EC2 Auto Scaling. Les alarmes déclenchent des actions uniquement pour les changements d'état prolongés. CloudWatch les alarmes ne déclencheront pas d'actions simplement parce qu'elles sont dans un état particulier ; l'état doit avoir changé et être maintenu pendant un certain nombre de périodes. Pour plus d’informations, consultez Surveillez vos instances à l'aide de CloudWatch.

  • Amazon EventBridge — automatisez vos AWS services et répondez automatiquement aux événements du système. Les événements issus AWS des services sont transmis EventBridge en temps quasi réel, et vous pouvez spécifier des actions automatisées à effectuer lorsqu'un événement correspond à une règle que vous avez écrite. Pour plus d'informations, consultez Qu'est-ce qu'Amazon EventBridge ? .

  • Amazon CloudWatch Logs : surveillez, stockez et accédez à vos fichiers journaux à partir d'instances Amazon EC2 ou d'autres sources. AWS CloudTrail Pour plus d'informations, consultez le guide de l'utilisateur d'Amazon CloudWatch Logs.

  • CloudWatch agent : collectez les journaux et les mesures au niveau du système auprès des hôtes et des invités sur vos instances EC2 et vos serveurs sur site. Pour plus d'informations, consultez la section Collecte de métriques et de journaux à partir d'instances Amazon EC2 et de serveurs sur site avec l' CloudWatch agent dans le guide de l'utilisateur Amazon CloudWatch .

Outils de surveillance manuelle

Un autre aspect important de la surveillance d'Amazon EC2 consiste à surveiller manuellement les éléments que les scripts de surveillance, les vérifications de statut et les CloudWatch alarmes ne couvrent pas. Les tableaux de bord Amazon EC2 et de CloudWatch la console fournissent un at-a-glance aperçu de l'état de votre environnement Amazon EC2.

  • Le tableau de bord Amazon EC2 affiche :

    • État du service et événements planifiés par région

    • État de l’instance

    • Contrôles des statuts

    • Statut des alarmes

    • Détails des métriques d’instance (Dans le panneau de navigation, choisissez instances, sélectionnez une instance, et choisissez l’onglet Surveillance)

    • Détails des métriques de volume (Dans le panneau de navigation, choisissez Volumes, sélectionnez un volume, et choisissez l’onglet Surveillance)

  • Le CloudWatch tableau de bord Amazon affiche :

    • Alarmes et statuts en cours

    • Graphiques des alarmes et des ressources

    • Statut d’intégrité du service

    En outre, vous pouvez utiliser CloudWatch pour effectuer les opérations suivantes :

    • Représenter graphiquement les données de surveillance Amazon EC2 pour résoudre les problèmes et découvrir les tendances

    • Recherchez et parcourez tous les indicateurs de vos AWS ressources

    • Créer et modifier des alarmes pour être informé des problèmes

    • Consultez un at-a-glance aperçu de vos alarmes et AWS de vos ressources