Création d’une alarme basée sur une source de données connectée - Amazon CloudWatch

Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.

Création d’une alarme basée sur une source de données connectée

Vous pouvez créer des alarmes qui surveillent les métriques provenant de sources de données absentes CloudWatch. Pour plus d’informations sur la création de connexions avec ces autres sources de données, veuillez consulter Interrogation de métriques d’autres sources de données.

Pour créer une alarme sur les métriques d’une source de données à laquelle vous êtes connecté
  1. Ouvrez la CloudWatch console à l'adresse https://console.aws.amazon.com/cloudwatch/.

  2. Dans le panneau de navigation, sélectionnez Métriques, Toutes les métriques.

  3. Choisissez l’onglet Requête multisource.

  4. Pour Sources de données, choisissez le nom de la source de données à utiliser.

  5. Le générateur de requêtes vous invite à saisir les informations nécessaires à la requête afin de récupérer les métriques à utiliser pour l’alarme. Le flux de travail est différent pour chaque source de données et est adapté à la source de données. Par exemple, pour les sources de données Amazon Managed Service for Prometheus et Prometheus, un éditeur de requêtes PromQL avec un assistant de requête apparaît.

  6. Lorsque vous avez terminé de créer la requête, choisissez Requête graphique.

  7. Si l’exemple de graphique se présente comme vous le souhaitez, choisissez Créer une alarme.

  8. La page Indiquer les métriques et les conditions s’affiche. Si la requête que vous utilisez produit plus d’une série temporelle, une bannière d’avertissement s’affiche en haut de la page. Si c’est le cas, sélectionnez une fonction à utiliser pour agréger les séries temporelles dans la fonction d’agrégation.

  9. (Facultatif) Ajoutez une étiquette pour l’alarme.

  10. Pour Whenever, your-metric-namec'est... , choisissez Plus grand, Plus grand/égal, inférieur/égal ou inférieur. Pour à . . ., spécifiez un nombre pour votre valeur de seuil.

  11. Sélectionnez Additional configuration (Configuration supplémentaire). Pour Datapoints to alarm (Points de données avant l'alerte), spécifiez le nombre de périodes d'évaluation (points de données) devant être à l'état ALARM pour déclencher l'alerte. Si les deux valeurs sont compatibles, vous créez une alerte qui passe à l'état ALARM lorsque le nombre de périodes consécutives dépasse ces valeurs.

    Pour créer une alerte M sur N, spécifiez un nombre pour la première valeur qui est inférieur à celui de la deuxième valeur. Pour plus d’informations, consultez Évaluation d'une alerte.

  12. Pour Missing data treatment (Traitement des données manquantes), choisissez comment l'alerte doit se comporter lorsqu'il manque certains points de données. Pour plus d’informations, consultez Configuration de la façon dont les CloudWatch alarmes traitent les données manquantes.

  13. Choisissez Suivant.

  14. Sous Notification, spécifiez une rubrique Amazon SNS qui doit recevoir une notification lorsque l’alarme passe à l’état ALARM, OK ou INSUFFICIENT_DATA.

    1. (Facultatif) Pour envoyer plusieurs notifications pour le même état d'alarme ou pour les différents états de l'alarme, sélectionnez Add notification (Ajouter une notification).

      Note

      Nous vous recommandons de configurer l’alarme pour qu’elle prenne des mesures lorsqu’elle passe en état Données insuffisantes, en plus de lorsqu’elle passe en état Alarme. En effet, de nombreux problèmes liés à la fonction Lambda qui se connecte à la source de données peuvent entraîner le passage de l’alarme à Données insuffisantes.

    2. (Facultatif) Pour ne pas envoyer de notifications Amazon SNS, choisissez Supprimer.

  15. Pour que l’alarme exécute des actions Auto Scaling, EC2, Lambda ou Systems Manager, cliquez sur le bouton approprié, puis choisissez l’état de l’alerte et l’action à effectuer. Si vous choisissez une fonction Lambda comme action d’alarme, vous spécifiez le nom de la fonction ou l’ARN, et vous pouvez éventuellement choisir une version spécifique de la fonction.

    Les alertes peuvent effectuer des actions du Systems Manager uniquement lorsqu'elles passent à l'état ALARM. Pour plus d'informations sur les actions de Systems Manager, voir Configuration CloudWatch pour créer à OpsItems partir d'alarmes et Création d'incidents.

    Note

    Pour créer une alerte qui exécute une action SSM Incident Manager, vous devez disposer de certaines autorisations. Pour plus d'informations, consultez les exemples de politiques basées sur l'identité pour AWS Systems Manager Incident Manager.

  16. Choisissez Suivant.

  17. Sous Add a description (Ajouter une description), saisissez un nom et une description pour l'alerte et choisissez Next (Suivant). Le nom ne doit contenir que des caractères UTF-8 et ne peut pas contenir de caractères de contrôle ASCII. La description peut inclure le formatage du markdown, qui s'affiche uniquement dans l'onglet Détails de l'alarme de la CloudWatch console. Le markdown peut être utile pour ajouter des liens vers des runbooks ou d'autres ressources internes.

    Astuce

    Le nom de l’alarme ne peut contenir que des caractères UTF-8. Il ne peut pas contenir de caractères de contrôle ASCII.

  18. Dans Preview and create (Prévisualiser et créer), confirmez que les informations et les conditions sont correctes, et choisissez Create alarm (Créer une alerte).

Informations sur les alarmes pour les sources de données connectées

  • Lorsqu'il CloudWatch évalue une alarme, il le fait toutes les minutes, même si la durée de l'alarme est supérieure à une minute. Pour que l’alarme fonctionne, la fonction Lambda doit pouvoir renvoyer une liste d’horodatages commençant à n’importe quelle minute, et pas seulement à des multiples de la durée de la période. Ces horodatages doivent être espacés d’une longueur de période.

    Par conséquent, si la source de données interrogée par le Lambda ne peut renvoyer que des horodatages multiples de la durée de la période, la fonction doit « rééchantillonner » les données extraites pour qu’elles correspondent aux horodatages attendus par la requête GetMetricData.

    Par exemple, une alarme avec une période de cinq minutes est évaluée toutes les minutes à l’aide de fenêtres de cinq minutes décalées d’une minute à chaque fois. Dans ce cas :

    • Pour l'évaluation de l'alarme à 12 h 15, des points de CloudWatch données sont attendus avec des horodatages de12:00:00, et. 12:05:00 12:10:00

    • Ensuite, pour l'évaluation de l'alarme à 12 h 16, on CloudWatch attend des points de données horodatés de12:01:00, et. 12:06:00 12:11:00

  • Lors de CloudWatch l'évaluation d'une alarme, tous les points de données renvoyés par la fonction Lambda qui ne correspondent pas aux horodatages attendus sont supprimés et l'alarme est évaluée en utilisant les points de données attendus restants. Par exemple, lorsque l’alarme est évaluée à 12:15:00, il attend des données horodatées 12:00:00, 12:05:00 et 12:10:00. S'il reçoit des données horodatées de12:00:00,, et 12:05:00 12:06:0012:10:00, les données sont supprimées 12:06:00 et CloudWatch évalue l'alarme en utilisant les autres horodatages.

    Ensuite, pour la prochaine évaluation à 12:16:00, il attend des données horodatées 12:01:00, 12:06:00 et 12:11:00. S’il n’a que les données horodatées 12:00:00, 12:05:00 et 12:10:00, tous ces points de données sont ignorés à 12 h 16 et l’alarme passe à l’état correspondant à celui que vous avez spécifié pour l’alarme en ce qui concerne le traitement des données manquantes. Pour plus d’informations, consultez Évaluation d'une alerte.

  • Nous vous recommandons de créer ces alarmes pour prendre des mesures lorsqu’elles passent à l’état INSUFFICIENT_DATA, car plusieurs cas d’utilisation d’une défaillance de la fonction Lambda feront passer l’alarme à INSUFFICIENT_DATA quelle que soit la manière dont vous l’avez configurée pour traiter les données manquantes.

  • Si la fonction Lambda renvoie une erreur ou renvoie des données partielles :

    • En cas de problème d’autorisation lors de l’appel de la fonction Lambda, l’alarme commence à présenter des transitions de données manquantes conformément à la façon dont vous avez spécifié l’alarme pour traiter les données manquantes lors de sa création.

    • Si la fonction Lambda retourne 'StatusCode' = 'PartialData', l’évaluation de l’alarme échoue et l’alarme passe à INSUFFICIENT_DATA au bout de trois tentatives, ce qui prend environ trois minutes.

    • Toute autre erreur provenant de la fonction Lambda entraîne le passage de l’alarme à INSUFFICIENT_DATA.

  • Si la métrique demandée par la fonction Lambda présente un retard tel que le dernier point de données est toujours manquant, vous devez utiliser une solution de contournement. Vous pouvez créer une alarme M sur N ou augmenter la période d’évaluation de l’alarme. Pour plus d’informations sur les alarmes M sur N, veuillez consulter Évaluation d'une alerte.