Utilisez CloudWatch des métriques pour surveiller Elastic Graphics - Amazon Elastic Compute Cloud

Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.

Utilisez CloudWatch des métriques pour surveiller Elastic Graphics

Important

Amazon Elastic Graphics a atteint sa fin de vie le 8 janvier 2024. Pour les charges de travail nécessitant une accélération graphique, nous vous recommandons d'utiliser des instances Amazon EC2 G4ad, G4dn ou G5.

Vous pouvez surveiller votre accélérateur Elastic Graphics à l'aide d'Amazon CloudWatch, qui collecte des statistiques sur les performances de votre accélérateur. Ces statistiques sont enregistrées pour une durée de deux semaines. Vous pouvez, par conséquent, accéder aux informations historiques et mieux comprendre la façon dont votre service fonctionne.

Par défaut, les accélérateurs Elastic Graphics envoient des données métriques par intervalles CloudWatch de 5 minutes.

Pour plus d'informations sur Amazon CloudWatch, consultez le guide de CloudWatch l'utilisateur Amazon.

Métriques pour un Elastic Graphics

L'espace de noms AWS/ElasticGPUs inclut les métriques suivantes pour Elastic Graphics.

Métrique Description

GPU ConnectivityCheckFailed

Indique si la connectivité avec l'accélérateur Elastic Graphics est active ou si elle a échoué. La valeur zéro (0) indique que la connexion est active. La valeur un (1) indique qu'elle a échoué.

Unités : nombre

GPU HealthCheckFailed

Indique si l'état de l'accélérateur Elastic Graphics a été vérifié au cours de la minute précédente. La valeur zéro (0) indique que le contrôle de statut a réussi. La valeur un (1) indique un échec du contrôle du statut.

Unités : nombre

GPU MemoryUtilization

Mémoire du GPU utilisée.

Unités : Mio

Dimensions d'Elastic Graphics

Vous pouvez filtrer les données de métriques de vos accélérateurs Elastic Graphics à l'aide des dimensions suivantes.

Dimension Description
EGPUId Filtre les données en fonction de l'accélérateur Elastic Graphics.
InstanceId Filtre les données en fonction de l'instance à laquelle l'accélérateur Elastic Graphics est attaché.

Afficher CloudWatch les statistiques pour Elastic Graphics

Les métriques sont d'abord regroupées par espaces de noms de service, puis par dimensions prises en charge. Vous pouvez utiliser les procédures suivantes pour afficher les métriques de vos accélérateurs Elastic Graphics.

Pour consulter les métriques d'Elastic Graphics à l'aide de la CloudWatch console
  1. Ouvrez la CloudWatch console à l'adresse https://console.aws.amazon.com/cloudwatch/.

  2. Si nécessaire, changez la région. À partir de la barre de navigation, sélectionnez la région dans laquelle réside votre accélérateur Elastic Graphics. Pour plus d'informations, consultez Régions et points de terminaison.

  3. Dans le volet de navigation, sélectionnez ‎Metrics (Métriques).

  4. Pour All metrics (Toutes les métriques), sélectionnez Elastic Graphics, Elastic Graphics Metrics (Métriques Elastic Graphics).

Pour afficher les métriques Elastic Graphics (AWS CLI)

Utilisez la commande list-metrics suivante :

aws cloudwatch list-metrics --namespace "AWS/ElasticGPUs"

Créez des CloudWatch alarmes pour surveiller Elastic Graphics

Vous pouvez créer une CloudWatch alarme qui envoie un message Amazon SNS lorsque l'alarme change d'état. Une alarme surveille une seule métrique sur une durée définie et envoie une notification à une rubrique Amazon SNS en fonction de la valeur de la métrique par rapport à un seuil donné sur un certain nombre de durées.

Vous pouvez, par exemple, créer une alarme qui surveille l'état d'un accélérateur Elastic Graphics et envoie une notification lorsque que la vérification de l'état de l'accélérateur graphique échoue à trois reprises consécutives pendant cinq minutes.

Pour créer une alarme pour le statut d'intégrité d'un accélérateur Elastic Graphics
  1. Ouvrez la CloudWatch console à l'adresse https://console.aws.amazon.com/cloudwatch/.

  2. Dans le volet de navigation, choisissez Alarmes, puis Créer une alarme.

  3. Choisissez Select metric (Sélectionner une métrique), Elastic Graphics, Elastic Graphics Metrics (Métriques Elastic Graphics).

  4. Sélectionnez la HealthCheckFailed métrique GPU, puis sélectionnez Select metric.

  5. Configurez l'alarme comme suit :

    1. Sous Alarm details (Détails de l'alarme), saisissez un nom et une description pour votre alarme. Pour Whenever (Quand), choisissez >= et entrez 1.

    2. Pour Actions, sélectionnez une liste de notifications existante ou choisissez Nouvelle liste.

    3. Sélectionnez Créer une alarme.