Surveiller Amazon EC2 - Amazon Elastic Compute Cloud

Surveiller Amazon EC2

La surveillance constitue une partie importante de la gestion de la fiabilité, de la disponibilité et des performances de vos instances Amazon Elastic Compute Cloud (Amazon EC2) et de vos solutions AWS. Vous devez recueillir les données de surveillance de toutes les parties de vos solutions AWS de telle sorte que vous puissiez déboguer plus facilement une éventuelle défaillance à plusieurs points. Cependant, avant de commencer à superviser Amazon EC2, créez un plan de surveillance qui inclut les questions suivantes :

  • Quels sont les objectifs de la surveillance ?

  • Quelles sont les ressources à surveiller ?

  • À quelle fréquence les ressources doivent-elles être surveillées ?

  • Quels outils de surveillance utiliser ?

  • Qui exécute les tâches de supervision ?

  • Qui doit être informé en cas de problème ?

Une fois que vous avez défini vos objectifs de surveillance et créé votre plan de surveillance, l'étape suivante consiste à définir une référence pour les performances normales d'Amazon EC2 dans votre environnement. Vous devez mesurer les performances d'Amazon EC2 à différents moments et sous différentes conditions de charge. Lorsque vous surveillez Amazon EC2, stockez l'historique des données de surveillance que vous collectez. Vous pouvez comparer les performances actuelles d'Amazon EC2 à leurs données historiques pour vous aider à identifier les modèles de performances normales et les anomalies de performances, et à concevoir les méthodes destinées à les prendre en compte. Par exemple, vous pouvez superviser l'utilisation de l'UC, les I/O de disque et l'utilisation réseau de vos instances EC2. Lorsque les performances se trouvent en dehors de votre référence établie, il se peut que vous ayez besoin de reconfigurer l'instance ou de l'optimiser pour réduire l'utilisation de l'UC, améliorer les I/O disque ou réduire le trafic réseau.

Pour établir une référence, vous devez, au moins, superviser les éléments suivants :

Élément à superviser Métrique Amazon EC2 Agent de surveillance/ CloudWatch Logs

Utilisation de l'UC

CPUUtilization

Utilisation réseau

NetworkIn

NetworkOut

Performances disque

DiskReadOps

DiskWriteOps

Lectures/écritures sur disque

DiskReadBytes

DiskWriteBytes

Utilisation de la mémoire, des échanges, de l'espace sur le disque et du fichier d'échange, collecte de journaux

[instances Linux et Windows Server] Collecte de métriques et de journaux à partir d'instances Amazon EC2 et de serveurs sur site avec l'agent CloudWatch

[Migration à partir de l'ancien agent CloudWatch Logs sur des instances Windows Server] Migrer la collecte de journaux d'instances Windows Server vers l'agent CloudWatch