Surveillance d'Amazon Redshift à l'aide de métriques CloudWatch - Amazon Redshift

Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.

Surveillance d'Amazon Redshift à l'aide de métriques CloudWatch

À l'aide CloudWatch des métriques d'Amazon Redshift, vous pouvez obtenir des informations sur l'état et les performances de votre cluster et consulter des informations au niveau du nœud. Lorsque vous utilisez ces métriques, gardez à l’esprit que chaque métrique est associée à une ou plusieurs dimensions. Ces dimensions vous indiquent à quoi s’applique la métrique, c’est-à-dire le champ d’application de la métrique. Amazon Redshift comporte les deux dimensions suivantes :

  • Les métriques ayant une dimension NodeID sont les métriques qui fournissent les données de performance des nœuds d’un cluster. Cet ensemble de métriques inclut les nœuds principaux et les nœuds de calcul. Exemples de métriques : CPUUtilization, ReadIOPS, WriteIOPS.

  • Les métriques qui n’ont qu’une dimension ClusterIdentifier sont celles qui fournissent les données de performance des clusters. Exemples de métriques : HealthStatus et MaintenanceMode.

    Note

    Dans certains cas de métriques, une métrique spécifique à un cluster représente une agrégation du comportements de nœuds. Dans ces cas, soyez attentif à l’interprétation de la valeur de la métrique, car le comportement du nœud principal est regroupé avec celui du nœud de calcul.

Pour obtenir des informations générales sur CloudWatch les métriques et les dimensions, consultez CloudWatch les concepts du guide de CloudWatch l'utilisateur Amazon.

Pour une description plus détaillée des CloudWatch métriques pour Amazon Redshift, consultez les sections suivantes.

Métriques Amazon Redshift

L’espace de noms AWS/Redshift inclut les métriques suivantes. Sauf indication contraire, les métriques sont collectées à intervalles d’une minute.

Title
Métrique Description
CommitQueueLength

Nombre de transactions en attente de validation à un moment donné dans le temps.

Unités : nombre

Dimensions : ClusterIdentifier

ConcurrencyScalingActiveClusters

Nombre de clusters de mise à l’échelle de la simultanéité qui traitent activement des requêtes à un instant donné.

Unités : nombre

Dimensions : ClusterIdentifier

ConcurrencyScalingSeconds

Nombre de secondes utilisées par les clusters de mise à l’échelle de la simultanéité qui traitent activement des requêtes.

Unités : nombre

Dimensions : ClusterIdentifier

CPUUtilization

Pourcentage d’utilisation de la CPU. Pour les clusters, cette métrique représente une agrégation de toutes les valeurs d’utilisation par l’UC des nœuds (principal et calcul).

Unités : pourcentage

Dimensions: ClusterIdentifier, NodeID

Dimensions : ClusterIdentifier

DatabaseConnections

Nombre de connexions de base de données d’un cluster.

Unités : nombre

Dimensions : ClusterIdentifier

HealthStatus

Indique l’état d’intégrité du cluster. Toutes les minutes, le cluster se connecte à sa base de données et exécute une requête simple. S’il est en mesure d’effectuer cette opération avec succès, le cluster est considéré comme sain. Sinon, le cluster est défectueux. Un état défectueux peut se produire lorsque la base de données du cluster subit une très lourde charge ou s’il y a un problème de configuration avec une base de données du cluster.

Note

Sur Amazon CloudWatch, cette métrique est signalée sous la forme 1 ou 0, tandis que dans la console Amazon Redshift, elle est affichée avec les mots HEALTHY ou UNHEALTHY pour des raisons de commodité. Lorsque cette métrique est affichée dans la console Amazon Redshift, les moyennes d’échantillonnage sont ignorées et seuls HEALTHY ou UNHEALTHY sont affichés. Sur Amazon CloudWatch, des valeurs différentes de 1 et 0 peuvent apparaître en raison d'un problème d'échantillonnage. Toute valeur inférieure à 1 pour HealthStatus est présentée en tant que 0 (UNHEALTHY).

Unités : nombre (1/0) (HEALTHY/UNHEALTHY dans la console Amazon Redshift)

Dimensions : ClusterIdentifier

MaintenanceMode

Indique si le cluster est en mode maintenance.

Note

Sur Amazon CloudWatch, cette métrique est signalée sous la forme 1 ou 0, tandis que dans la console Amazon Redshift, elle est affichée avec les mots ON ou OFF pour des raisons de commodité. Lorsque cette métrique est affichée dans la console Amazon Redshift, les moyennes d’échantillonnage sont ignorées et seuls ON ou OFF sont affichés. Sur Amazon CloudWatch, des valeurs différentes de 1 et 0 peuvent apparaître en raison de problèmes d'échantillonnage. Toute valeur supérieure à 0 pour MaintenanceMode est présentée en tant que 1 (ON).

Unités : nombre (1/0) (ON/OFF dans la console Amazon Redshift).

Dimensions : ClusterIdentifier

MaxConfiguredConcurrencyScalingClusters

Nombre maximum de clusters de mise à l’échelle de la simultanéité configurés à partir du groupe de paramètres. Pour plus d’informations, consultez Groupes de paramètres Amazon Redshift.

Unités : nombre

Dimensions : ClusterIdentifier

NetworkReceiveThroughput

Débit auquel le nœud ou cluster reçoit des données.

Unités : octets/seconde (Mo/s dans la console Amazon Redshift)

Dimensions: ClusterIdentifier, NodeID

Dimensions : ClusterIdentifier

NetworkTransmitThroughput

Débit auquel le nœud ou cluster écrit des données.

Unités : octets/seconde (Mo/s dans la console Amazon Redshift)

Dimensions: ClusterIdentifier, NodeID

Dimensions : ClusterIdentifier

PercentageDiskSpaceUsed

Pourcentage d’espace disque utilisé.

Unités : pourcentage

Dimensions : ClusterIdentifier

Dimensions: ClusterIdentifier, NodeID

QueriesCompletedPerSecond

Nombre moyen de requêtes terminées par seconde. Communiqué par intervalles de 5 minutes. Cette métrique n'est pas prise en charge sur les clusters à nœud unique.

Unités : nombre/seconde

Dimensions: ClusterIdentifier, latency

Dimensions: ClusterIdentifier, wlmid

QueryDuration

Durée moyenne pour exécuter une requête. Communiqué par intervalles de 5 minutes. Cette métrique n'est pas prise en charge sur les clusters à nœud unique.

Unités : microsecondes

Dimensions : ClusterIdentifier, NodeID, latency

Dimensions: ClusterIdentifier, latency

Dimensions : ClusterIdentifier, NodeID, wlmid

QueryRuntimeBreakdown

Durée totale des requêtes exécutées par étape de requête. Communiqué par intervalles de 5 minutes.

Unités : millisecondes

Dimensions : ClusterIdentifier, NodeId, scène

Dimensions : ClusterIdentifier scène

ReadIOPS

Nombre moyen d’opérations de lecture de disque par seconde.

Unités : nombre/seconde

Dimensions: ClusterIdentifier, NodeID

Dimensions : ClusterIdentifier

ReadLatency

Temps moyen nécessaire pour les opérations d’I/O de lecture de disque.

Unités : secondes

Dimensions: ClusterIdentifier, NodeID

Dimensions : ClusterIdentifier

ReadThroughput

Nombre moyen d’octets lus sur le disque par seconde.

Unités : octets (Go/s dans la console Amazon Redshift)

Dimensions: ClusterIdentifier, NodeID

Dimensions : ClusterIdentifier

RedshiftManagedStorageTotalCapacity

Capacité de stockage géré totale.

Unités : mégaoctets

Dimensions : ClusterIdentifier

TotalTableCount

Nombre de tables utilisateur créées à un moment spécifique. Ce total n’inclut pas les tables Amazon Redshift Spectrum.

Unités : nombre

Dimensions : ClusterIdentifier

WLMQueueLength

Nombre de requêtes en attente d’entrée dans la file d’attente de gestion de la charge de travail (WLM).

Unités : nombre

Dimensions: ClusterIdentifier, service class

Dimensions: ClusterIdentifier, QueueName

WLMQueueWaitTime

Temps total pendant lequel les requêtes attendent dans la file d’attente de gestion des charges de travail. Communiqué par intervalles de 5 minutes.

Unités : millisecondes.

Dimensions: ClusterIdentifier, QueryPriority

Dimensions: ClusterIdentifier, wlmid

Dimensions: ClusterIdentifier, QueueName

WLMQueriesCompletedPerSecond

Nombre moyen de requêtes terminées par seconde pour une file d’attente de gestion de la charge de travail (WLM). Communiqué par intervalles de 5 minutes. Cette métrique n'est pas prise en charge sur les clusters à nœud unique.

Unités : nombre/seconde

Dimensions: ClusterIdentifier, wlmid

Dimensions: ClusterIdentifier, QueueName

WLMQueryDuration

Durée moyenne pour exécuter une requête pour une file d’attente de gestion de la charge de travail (WLM). Communiqué par intervalles de 5 minutes. Cette métrique n'est pas prise en charge sur les clusters à nœud unique.

Unités : microsecondes

Dimensions: ClusterIdentifier, wlmid

Dimensions: ClusterIdentifier, QueueName

WLMRunningQueries

Le nombre de requêtes s’exécutant depuis le cluster principal et le cluster de mise à l’échelle de simultanéité par file d’attente WLM.

Unités : nombre

Dimensions: ClusterIdentifier, wlmid

Dimensions: ClusterIdentifier, QueueName

WriteIOPS

Nombre moyen d’opérations d’écriture par seconde.

Unités : nombre/seconde

Dimensions: ClusterIdentifier, NodeID

Dimensions : ClusterIdentifier

WriteLatency

Temps moyen nécessaire pour les opérations d’I/O d’écriture de disque.

Unités : secondes

Dimensions: ClusterIdentifier, NodeID

Dimensions : ClusterIdentifier

WriteThroughput

Nombre moyen d’octets écrits sur le disque par seconde.

Unités : octets (Go/s dans la console Amazon Redshift)

Dimensions: ClusterIdentifier, NodeID

Dimensions : ClusterIdentifier

SchemaQuota

Quota configuré pour un schéma.

Unités : mégaoctets

Dimensions : ClusterIdentifier, Database, Schema

Périodique/Push : Periodic

Fréquence : 5 minutes

Critères d’arrêt : schéma abandonné ou quota supprimé

NumExceededSchemaQuotas

Nombre de schémas avec des quotas dépassés.

Unités : nombre

Dimensions : ClusterIdentifier

Périodique/Push : Periodic

Fréquence : 5 minutes

Critères d’arrêt : N/A

StorageUsed

Espace disque ou de stockage utilisé par un schéma.

Unités : mégaoctets

Dimensions : ClusterIdentifier, Database, Schema

Périodique/Push : Periodic

Fréquence : 5 minutes

Critères d’arrêt : schéma abandonné ou quota supprimé

PercentageQuotaUsed

Pourcentage d’espace disque ou de stockage utilisé par rapport au quota de schéma configuré.

Unités : pourcentage

Dimensions : ClusterIdentifier, Database, Schema

Périodique/Push : Periodic

Fréquence : 5 minutes

Critères d’arrêt : schéma abandonné ou quota supprimé

UsageLimitAvailable

En fonction de FeatureType, UsageLimitAvailable renvoie ce qui suit :

  • Si tel FeatureType est le casCONCURRENCY_SCALING, UsageLimitAvailable renvoie le temps total qui peut être utilisé par la mise à l'échelle simultanée par incréments d'une minute.

  • Si tel FeatureType est le casCROSS_REGION_DATASHARING, UsageLimitAvailable renvoie la quantité totale de données pouvant être numérisées par incréments de 1 To.

  • Si tel FeatureType est le casSPECTRUM, UsageLimitAvailable renvoie la quantité totale de données pouvant être numérisées par incréments de 1 To.

Unités : minutes ou To

Dimensions : ClusterIdentifier, FeatureType, UsageLimitId

UsageLimitConsumed

En fonction de FeatureType, UsageLimitConsumed renvoie ce qui suit :

  • Si tel FeatureType est le casCONCURRENCY_SCALING, UsageLimitAvailable renvoie le temps total utilisé par la mise à l'échelle de la simultanéité par incréments d'une minute.

  • Si tel FeatureType est le casCROSS_REGION_DATASHARING, UsageLimitAvailable renvoie la quantité totale de données numérisées par incréments de 1 To.

  • Si tel FeatureType est le casSPECTRUM, UsageLimitAvailable renvoie la quantité totale de données numérisées par incréments de 1 To.

Unités : minutes ou To

Dimensions : ClusterIdentifier, FeatureType, UsageLimitId

Dimensions des métriques Amazon Redshift

Les données Amazon Redshift peuvent être filtrées selon n’importe quelle dimension dans le tableau suivant.

Dimension Description
latency

Les valeurs possibles sont les suivantes :

  • short – moins de 10 secondes

  • medium – entre 10 secondes et 10 minutes

  • long – plus de 10 minutes

NodeID

Les filtres ont demandé des données spécifiques aux nœuds d’un cluster. NodeID a la valeur « Principal », « Partagé » ou « Calcul-N » où N est égal à 0, 1, ... pour le nombre de nœuds du cluster. « Shared » signifie que le cluster a un seul nœud, c’est-à-dire le nœud principal, et que les nœuds de calcul sont associés.

Les métriques pour CPUUtilization, NetworkTransmitThroughput et ReadIOPS sont communiquées uniquement pour le nœud principal et les nœuds de calcul. Les autres métriques qui utilisent la dimension NodeId sont communiquées uniquement pour les nœuds de calcul.

ClusterIdentifier

Les filtres ont demandé des données spécifiques au cluster. Les métriques spécifiques aux clusters incluent HealthStatus, MaintenanceMode et DatabaseConnections. Les métriques générales de cette dimension (par exemple ReadIOPS) qui sont également des métriques de nœuds représentent une agrégation des données des métriques de nœud. Veillez à interpréter ces métriques parce qu’elles regroupent un comportement de nœud principal et de nœuds de calcul.

service class

Identifiant d’une classe de service WLM.

stage

Étapes de l’exécution d’une requête. Les valeurs possibles sont les suivantes :

  • QueryPlanning: temps passé à analyser et à optimiser les instructions SQL.

  • QueryWaiting: temps passé à attendre dans la file d'attente WLM.

  • QueryExecutingRead: temps passé à exécuter des requêtes de lecture.

  • QueryExecutingInsert: temps passé à exécuter des requêtes d'insertion.

  • QueryExecutingDelete: temps passé à exécuter des requêtes de suppression.

  • QueryExecutingUpdate: temps passé à exécuter des requêtes de mise à jour.

  • QueryExecutingCtas: Temps passé à exécuter la création de la table sous forme de requêtes.

  • QueryExecutingUnload: temps passé à exécuter des requêtes de déchargement.

  • QueryExecutingCopy: temps passé à exécuter des requêtes de copie.

  • QueryCommit: Temps passé à s'engager.

wlmid

Identifiant d’une file d’attente de gestion de la charge de travail.

QueryPriority

Priorité de la requête. Les valeurs possibles sont CRITICAL, HIGHEST, HIGH, NORMAL, LOW et LOWEST.

QueueName

Nom de la file d’attente de gestion des charges de travail.

FeatureType

Fonctionnalité limitée par une limite d’utilisation. Les valeurs possibles sont CONCURRENCY_SCALING, CROSS_REGION_DATASHARING et SPECTRUM.

UsageLimitId

Identifiant d’une limite d’utilisation.

Données de performances de charge et de requête Amazon Redshift

Outre les CloudWatch métriques, Amazon Redshift fournit des données sur les performances des requêtes et des chargements. Les données de performance de chargement et de requête peuvent vous aider à comprendre la relation entre les performances de base de données et les métriques de cluster. Par exemple, si vous remarquez que l’UC d’un cluster a des pics, vous pouvez trouver le pic dans le graphique de l’UC du cluster et afficher les requêtes qui s’exécutaient à ce moment-là. Inversement, si vous examinez une requête spécifique, les données des métriques (comme l’UC) s’affichent dans le contexte afin que vous puissiez comprendre l’impact de la requête sur les métriques de cluster.

Les données de performance des requêtes et des chargements ne sont pas publiées sous forme de CloudWatch métriques et ne peuvent être consultées que dans la console Amazon Redshift. Les données de performance de requête et de chargement sont générées à partir de requêtes avec les tables système de votre base de données (pour de plus amples informations, consultez Référence des tables système dans le Guide du développeur Amazon Redshift). Vous pouvez également générer vos propres requêtes de performances de base de données, mais nous vous recommandons de commencer par les données de performance de chargement et de requête présentées dans la console. Pour plus d’informations sur la mesure et la surveillance des performances de votre base de données par vous-même, consultez Gestion des performances dans le Guide du développeur Amazon Redshift.

Le tableau suivant décrit les différents aspects des données de requête et de chargement auxquels vous pouvez accéder dans la console Amazon Redshift.

Données de chargement et de requête Description
Résumé des requêtes

Liste de requêtes sur une durée déterminée. La liste peut être triée sur des valeurs telles que l’ID de requête, la durée d’exécution et l’état. Affichez ces données dans l’onglet Surveillance des requêtes de la page de détails du cluster.

Détails de la requête

Fournit des détails sur une requête donnée, notamment :

  • Propriétés de la requête, telles que l’ID de requête, le type, le cluster sur lequel la requête a été exécutée et la durée d’exécution.

  • Détails tels que l’état de la requête et le nombre d’erreurs.

  • Instruction SQL exécutée.

  • Plan d’explication s’il est disponible.

  • Données de performances du cluster pendant l’exécution de la requête (pour de plus amples informations, consultez Affichage de l’historique des requêtes).

Résumé des charges

Répertorie toutes les charges sur une durée déterminée. La liste peut être triée sur des valeurs telles que l’ID de requête, la durée d’exécution et l’état. Affichez ces données dans l’onglet Surveillance des requêtes de la page de détails du cluster.

Détails de charge

Fournit des détails sur une opération de charge particulière, notamment :

  • Propriétés de la charge, telles que l’ID de requête, le type, le cluster sur lequel la requête a été exécutée et la durée d’exécution.

  • Détails tels que l’état de la charge et le nombre d’erreurs.

  • Instruction SQL exécutée.

  • Liste des fichiers chargés.

  • Données de performances du cluster pendant l’opération de chargement (pour de plus amples informations, consultez Affichage de l’historique des requêtes).