Alarmes métriques dans Lightsail - Amazon Lightsail

Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.

Alarmes métriques dans Lightsail

Vous pouvez créer une alarme dans Amazon Lightsail qui surveille une métrique unique pour vos instances, vos bases de données, vos équilibreurs de charge et vos distributions de réseaux de diffusion de contenu (CDN). Cette alarme peut être configurée pour vous avertir en fonction de la valeur de la métrique par rapport à un seuil que vous spécifiez. Les notifications peuvent être transmises via une bannière affichée dans la console Lightsail, un e-mail envoyé à votre adresse e-mail ou un SMS envoyé à votre numéro de téléphone mobile. Dans ce guide, nous décrivons les conditions d'alarme et les paramètres que vous pouvez configurer.

Table des matières

Configuration d'une alarme

Pour ajouter une alarme dans la console Lightsail, accédez à l'onglet Metrics de votre instance, de votre base de données, de votre équilibreur de charge ou de votre distribution CDN. Choisissez ensuite la métrique que vous souhaitez surveiller et choisissez Ajouter une alarme. Vous pouvez ajouter deux alarmes par métrique. Pour plus d'informations sur les métriques, veuillez consulter Métriques des ressources.

Pour configurer l'alarme, vous devez d'abord identifier une valeur de seuil, qui est la valeur de métrique pour laquelle l'alarme va changer d'état (p. ex., passer d'un état OK à un état ALARM, ou vice versa). Pour de plus amples informations, veuillez consulter États des alarmes. Ensuite, vous devez sélectionner l'opérateur de comparaison à utiliser pour comparer la métrique au seuil. Les opérateurs disponibles sont supérieur ou égal à, supérieur à, inférieur à et inférieur ou égal à.

Vous spécifiez ensuite le nombre de fois que le seuil doit être franchi, ainsi que la période pendant laquelle la métrique sera évaluée pour que l'alarme change d'état. Lightsail évalue les points de données pour détecter les alarmes toutes les 5 minutes, et chaque point de données représente une période de 5 minutes de données agrégées. Par exemple, si vous spécifiez le déclenchement de l'alarme lorsque le seuil est franchi 2 fois, la période d'évaluation doit se situer dans les 10 dernières minutes ou plus (jusqu'à 24 heures). Si vous définissez le déclenchement de l'alarme lorsque le seuil est franchi 10 fois, la période d'évaluation doit se situer dans les 50 dernières minutes ou plus (jusqu'à 24 heures).

Après avoir configuré les conditions de l'alarme, vous pouvez configurer la façon dont vous souhaitez être averti. Les bannières de notification s'affichent toujours dans la console Lightsail lorsque l'alarme passe d'OKun état à un autre. ALARM Vous pouvez également choisir d'être averti par e-mail ou SMS, mais vous devez configurer les contacts de notification pour ceux-ci. Pour plus d'informations, veuillez consulter Notifications de métrique. Si vous choisissez d'être averti par e-mail et/ou SMS, vous pouvez également choisir d'être averti lorsque l'état de l'alarme passe d'un état ALARM à un état OK, ce qui est considéré comme une notification de fin d'alerte.

Dans les paramètres avancés de l'alarme, vous pouvez choisir la manière dont Lightsail traite les données métriques manquantes. Pour plus d'informations, veuillez consulter Configuration de la manière dont les alertes doivent traiter les données manquantes.

États des alarmes

Une alarme est toujours dans l'un des états suivants :

  • ALARM : la métrique est au-delà du seuil défini.

    Par exemple, si vous choisissez un opérateur de comparaison supérieur à, l'alarme est dans un état ALARM lorsque la métrique est supérieure au seuil spécifié. Si vous choisissez un opérateur de comparaison inférieur à, l'alarme est dans un état ALARM lorsque la métrique est inférieure au seuil spécifié.

  • OK : la métrique se trouve dans le seuil défini.

    Par exemple, si vous choisissez un opérateur de comparaison supérieur à, l'alarme est dans un état OK lorsque la métrique est inférieure au seuil spécifié. Si vous choisissez un opérateur de comparaison inférieur à, l'alarme est dans un état OK lorsque la métrique est supérieure au seuil spécifié.

  • INSUFFICIENT_DATA : l'alarme vient de démarrer, la métrique n'est pas disponible ou la quantité de données disponibles n'est pas suffisante pour permettre de déterminer l'état de l'alarme.

Les alarmes sont déclenchées uniquement lors d'un changement d'état. Les alarmes ne sont pas déclenchées simplement parce qu'elles se trouvent dans un état particulier. L'état doit avoir changé. Lorsqu'une alarme est déclenchée, une bannière s'affiche dans la console Lightsail. Vous pouvez également configurer des alarmes pour vous avertir par e-mail ou SMS.

Exemple d'alarme

Compte tenu des conditions d'alarme décrites précédemment, vous pouvez configurer une alarme qui passe à l'état ALARM lorsque l'utilisation du processeur d'une instance est supérieure ou égale à 5 % une fois dans une période individuelle de 5 minutes. L'exemple suivant montre les paramètres de cette alarme dans la console Lightsail.

Exemple d'alarme d'utilisation du processeur

Dans cet exemple, si la métrique d'utilisation du processeur de l'instance signale une utilisation de 5 % ou plus dans un seul point de données, l'alarme passe de l'état OK à l'état ALARM. Chaque point de données suivant signalé correspondant à une utilisation supérieure ou égale à 5 % maintient l'alarme à l'état ALARM. Lorsque la métrique d'utilisation du processeur de l'instance signale une utilisation de 4,9 % ou moins dans un seul point de données, l'alarme passe de l'état ALARM à l'état OK.

Le graphique suivant illustre cette alarme. La ligne pointillée rouge représente le seuil de 5 % d'utilisation du processeur et les points bleus représentent les points de données de la métrique. L'alarme est dans l'état OK pour le premier point de données. Le deuxième point de données fait passer l'alarme à l'état ALARM car le point de données est supérieur au seuil. Les troisième et quatrième points de données maintiennent l'alarme dans l'état ALARM, car les points de données restent supérieurs au seuil. Le cinquième point de données fait passer l'alarme à l'état OK car le point de données est inférieur au seuil.

Exemple de métrique déclenchant une alarme

Configuration de la manière dont les alertes traitent les données manquantes

Dans certains cas, certains points de données pour une métrique avec alarme ne sont pas signalés. Par exemple, cela peut se produire lors d'une perte de connexion ou lors d'une panne d'un serveur.

Lightsail vous permet de définir comment traiter les points de données manquants lors de la configuration d'une alarme. Cela peut vous aider à configurer votre alarme afin qu'elle passe à l'état ALARM lorsque cela s'avère approprié pour le type de données surveillées. Vous pouvez éviter les faux positifs lorsque les données manquantes n'indiquent pas de problème.

Trois états peuvent correspondre à une alarme. De la même manière, chaque point de données spécifique signalé entre dans l'une des trois catégories suivantes :

  • Seuil non dépassé : le point de données se trouve à l'intérieur du seuil.

    Par exemple, si vous choisissez un opérateur de comparaison supérieur à, le point de données est Not breaching lorsqu'il est inférieur au seuil spécifié. Si vous choisissez un opérateur de comparaison inférieur à, le point de données est Not breaching lorsqu'il est supérieur au seuil spécifié.

  • Seuil dépassé : le point de données est au-delà du seuil.

    Par exemple, si vous choisissez un opérateur de comparaison supérieur à, le point de données est Breaching lorsqu'il est supérieur au seuil spécifié. Si vous choisissez un opérateur de comparaison inférieur à, le point de données est Breaching lorsqu'il est inférieur au seuil spécifié.

  • Manquant : le comportement des points de données manquants est spécifié par le paramètre treat missing data.

Pour chaque alarme, vous pouvez configurer Lightsail pour traiter les points de données manquants comme suit :

  • Seuil non dépassé : les points de données manquants sont traités comme étant corrects et en-deçà du seuil.

  • Seuil dépassé : les points de données manquants sont traités comme étant incorrects et au-delà du seuil.

  • Ignorer : l'état actuel de l'alarme est conservé.

  • Manquant : l'alarme ne prend pas en compte les points de données manquants lorsqu'elle évalue si l'état doit être modifié. Il s'agit du comportement par défaut des alarmes.

Le choix le plus adapté dépend du type de métrique. Pour une métrique telle que l'utilisation du processeur d'une instance, vous pouvez traiter les points de données manquants comme étant au-delà du seuil. En effet, les points de données manquants peuvent indiquer que quelque chose ne va pas. Toutefois, pour une métrique qui génère des points de données uniquement lorsqu'une erreur se produit, telle que le nombre d'erreurs de serveur HTTP 500 d'un équilibreur de charge, vous pouvez traiter les données manquantes comme n'étant pas au-delà du seuil.

Choisir la meilleure option pour votre alarme évite les changements inutiles et trompeurs de condition d'alarme. Cela indique également plus précisément l'intégrité du système.

Évaluation de l'état de l'alerte lorsqu'il manque des données

Quelle que soit la valeur que vous définissez pour le traitement des données manquantes, lorsqu'une alarme indique s'il faut changer d'état, Lightsail tente de récupérer un plus grand nombre de points de données que celui spécifié par les périodes d'évaluation. Le nombre exact de points de données qu'il tente de récupérer dépend de la durée de la période d'alarme. La période des points de données qu'il tente de récupérer est la plage d'évaluation.

Une fois que Lightsail a récupéré ces points de données, voici ce qui se passe :

  • S'il ne manque aucun point de données dans la plage d'évaluation, Lightsail évalue l'alarme en fonction des derniers points de données collectés.

  • Si certains points de données de la plage d'évaluation sont manquants, mais que le nombre de points de données existants collectés est égal ou supérieur aux périodes d'évaluation de l'alarme, Lightsail évalue l'état de l'alarme en fonction des points de données existants les plus récents qui ont été collectés avec succès. Dans ce cas, la valeur que vous avez définie pour traiter les données manquantes n'est pas nécessaire et elle est ignorée.

  • Si certains points de données de la plage d'évaluation sont manquants et que le nombre de points de données existants collectés est inférieur au nombre de périodes d'évaluation de l'alarme, Lightsail remplit les points de données manquants avec le résultat que vous avez spécifié sur la manière de traiter les données manquantes, puis évalue l'alarme. Toutefois, les points de données réels de la plage d'évaluation, peu importe le moment où ils ont été signalés, sont inclus dans l'évaluation. Lightsail n'utilise les points de données manquants que le moins de fois possible.

Dans toutes ces situations, le nombre de points de données évalués est égal à la valeur Evaluation periods (Périodes d'évaluation). Si le nombre de points de données au-delà du seuil est inférieur à la valeur Datapoints to alarm (Points de données avant l'alarme), l'état de l'alarme est défini sur OK. Sinon, l'état est défini sur ALARM.

Note

Ce comportement est notamment dû au fait que les alarmes Lightsail peuvent réévaluer à plusieurs reprises le dernier ensemble de points de données pendant un certain temps après l'arrêt de la métrique. Cette réévaluation peut entraîner le changement d'état de l'alarme et la réexécution d'actions, si le changement d'état est survenu immédiatement avant l'interruption du flux de la métrique. Pour atténuer ce comportement, utilisez des périodes plus courtes.

Données manquantes dans des exemples graphiques

Les graphiques suivants de cette section illustrent des exemples du comportement d'évaluation de l'alarme. Dans les graphiques A, B, C, D et E, les points de données qui doivent dépasser le seuil d'alarme et les périodes d'évaluation sont de 3. La ligne pointillée rouge représente le seuil, les points bleus représentent les points de données valides et les tirets représentent les données manquantes. Les points de données situés au-dessus de la ligne de seuil sont au-delà du seuil, et les points de données situés au-dessous du seuil ne le sont pas. Si certains des trois points de données les plus récents sont manquants, Lightsail tentera de récupérer des points de données valides supplémentaires.

Note

Si des points de données sont manquants peu après la création d'une alarme et que la métrique a été signalée à Lightsail avant que vous ne créiez l'alarme, Lightsail récupère les points de données les plus récents avant la création de l'alarme lors de l'évaluation de l'alarme.

Graphique A

Graphique A avec données manquantes

Dans la représentation graphique de métrique précédente, le point de données 1 est en-deçà du seuil, le point de données 2 est manquant, le point de données 3 est au-delà du seuil, le point de données 4 est manquant et le point de données 5 est au-delà du seuil. Étant donné qu'il y a trois points de données valides dans la plage d'évaluation, cette métrique n'a aucun point de données manquant. Si vous avez configuré une alarme pour traiter les points de données manquants comme suit :

  • Seuil non dépassé : l'alarme serait dans un état OK.

  • Seuil dépassé : l'alarme serait dans un état OK.

  • Ignorer : l'alarme serait dans un état OK.

  • Manquant : l'alarme serait dans un état OK.

Graphique B

Graphique B avec données manquantes

Dans la représentation graphique de métrique précédente, le point de données 1 est en-deçà du seuil et les points de données 2 à 5 sont manquants. Étant donné qu'il n'y a qu'un seul point de données dans la plage d'évaluation, cette métrique comporte deux points de données manquants. Si vous avez configuré une alarme pour traiter les points de données manquants comme suit :

  • Seuil non dépassé : l'alarme serait dans un état OK.

  • Seuil dépassé : l'alarme serait dans un état OK.

  • Ignorer : l'alarme serait dans un état OK.

  • Manquant : l'alarme serait dans un état OK.

Dans ce scénario, l'alarme resterait dans l'état OK, même si les données manquantes sont traitées comme étant au-delà du seuil. Cela est dû au fait que le seul point de données existant est en-deçà du seuil, et ceci est évalué avec deux points de données manquants qui sont traités comme étant au-delà du seuil. La prochaine fois que cette alarme est évaluée, si les données sont toujours manquantes, l'alarme passe à l'état ALARM. Cela est dû au fait que le point de données en-deçà du seuil ne figure plus parmi les cinq points de données les plus récents récupérés.

Graphique C

Graphique C avec données manquantes

Tous les points de données sont manquants dans la représentation graphique de métrique précédente. Étant donné que tous les points de données sont manquants dans la plage d'évaluation, cette métrique comporte trois points de données manquants. Si vous avez configuré une alarme pour traiter les points de données manquants comme suit :

  • Seuil non dépassé : l'alarme serait dans un état OK.

  • Seuil dépassé : l'alarme serait dans un état ALARM.

  • Ignorer : l'alarme conserverait l'état actuel.

  • Manquant : l'alarme serait dans un état INSUFFICIENT_DATA.

Graphique D

Graphique D avec données manquantes

Dans la représentation graphique de métrique précédente, le point de données 1 est en-deçà du seuil, le point de données 2 est au-delà du seuil, le point de données 3 est au-delà du seuil, le point de données 4 est manquant et le point de données 5 est au-delà du seuil. Étant donné qu'il y a quatre points de données valides dans la plage d'évaluation, cette métrique n'a aucun point de données manquant. Si vous avez configuré une alarme pour traiter les points de données manquants comme suit :

  • Seuil non dépassé : l'alarme serait dans un état ALARM.

  • Seuil dépassé : l'alarme serait dans un état ALARM.

  • Ignorer : l'alarme serait dans un état ALARM.

  • Manquant : l'alarme serait dans un état ALARM.

Dans ce scénario, l'alarme passe à l'état ALARM dans tous les cas. Cela tient au fait qu'il y a suffisamment de points de données réels pour que le paramètre relatif au traitement des données manquantes ne soit pas requis, et soit donc ignoré.

Graphique E

Graphique E avec données manquantes

Dans la représentation graphique de métrique précédente, les points de données 1 et 2 sont manquants, le point de données 3 est au-delà du seuil et les points de données 4 et 5 sont manquants. Étant donné qu'il n'y a qu'un seul point de données dans la plage d'évaluation, cette métrique comporte deux points de données manquants. Si vous avez configuré une alarme pour traiter les points de données manquants comme suit :

  • Seuil non dépassé : l'alarme serait dans un état OK.

  • Seuil dépassé : l'alarme serait dans un état ALARM.

  • Ignorer : l'alarme conserverait l'état actuel.

  • Manquant : l'alarme serait dans un état ALARM.

Dans les graphiques F, G, H, I et J, la valeur Datapoints to alarm (Points de données avant l'alarme) est égale à 2 tandis que la valeur Evaluation periods (Périodes d'évaluation) est égale à 3. Il s'agit d'une alarme 2 sur 3, M sur N. 5 est la plage d'évaluation pour l'alarme.

Graphique F

Graphique F avec données manquantes

Dans la représentation graphique de métrique précédente, le point de données 1 est en-deçà du seuil, le point de données 2 est manquant, le point de données 3 est au-delà du seuil, le point de données 4 est manquant et le point de données 5 est au-delà du seuil. Étant donné qu'il y a trois points de données dans la plage d'évaluation, cette métrique n'a aucun point de données manquant. Si vous avez configuré une alarme pour traiter les points de données manquants comme suit :

  • Seuil non dépassé : l'alarme serait dans un état ALARM.

  • Seuil dépassé : l'alarme serait dans un état ALARM.

  • Ignorer : l'alarme serait dans un état ALARM.

  • Manquant : l'alarme serait dans un état ALARM.

Graphique G

Graphique G avec données manquantes

Dans la représentation graphique de métrique précédente, les points de données 1 et 2 sont en-deçà du seuil, le point de données 3 est au-delà du seuil, le point de données 4 est en-deçà du seuil, le point de données 5 est au-delà du seuil. Étant donné qu'il y a cinq points de données dans la plage d'évaluation, cette métrique n'a aucun point de données manquant. Si vous avez configuré une alarme pour traiter les points de données manquants comme suit :

  • Seuil non dépassé : l'alarme serait dans un état ALARM.

  • Seuil dépassé : l'alarme serait dans un état ALARM.

  • Ignorer : l'alarme serait dans un état ALARM.

  • Manquant : l'alarme serait dans un état ALARM.

Graphique H

Graphique H avec données manquantes

Dans la représentation graphique de métrique précédente, le point de données 1 est en-deçà du seuil, le point de données 2 est manquant, le point de données 3 est au-delà du seuil et les points de données 4 et 5 sont manquants. Étant donné qu'il y a deux points de données dans la plage d'évaluation, cette métrique a un point de données manquant. Si vous avez configuré une alarme pour traiter les points de données manquants comme suit :

  • Seuil non dépassé : l'alarme serait dans un état OK.

  • Seuil dépassé : l'alarme serait dans un état ALARM.

  • Ignorer : l'alarme serait dans un état OK.

  • Manquant : l'alarme serait dans un état OK.

Graphique I

Graphique I avec données manquantes

Dans la représentation graphique de métrique précédente, les points de données 1 à 4 sont manquants et le point de données 5 est en-deçà du seuil. Étant donné qu'il y a un seul point de données dans la plage d'évaluation, cette métrique a deux points de données manquants. Si vous avez configuré une alarme pour traiter les points de données manquants comme suit :

  • Seuil non dépassé : l'alarme serait dans un état OK.

  • Seuil dépassé : l'alarme serait dans un état ALARM.

  • Ignorer : l'alarme serait dans un état OK.

  • Manquant : l'alarme serait dans un état OK.

Graphique J

Graphique J avec données manquantes

Dans la représentation graphique de métrique précédente, les points de données 1 et 2 sont manquants, le point de données 3 est au-delà du seuil et les points de données 4 et 5 sont manquants. Étant donné qu'il y a un seul point de données dans la plage d'évaluation, cette métrique a deux points de données manquants. Si vous avez configuré une alarme pour traiter les points de données manquants comme suit :

  • Seuil non dépassé : l'alarme serait dans un état OK.

  • Seuil dépassé : l'alarme serait dans un état ALARM.

  • Ignorer : l'alarme conserverait l'état actuel.

  • Manquant : l'alarme serait dans un état ALARM.

Informations supplémentaires sur les alarmes

Voici quelques articles qui vous aideront à gérer les alarmes dans Lightsail :