Monitoreo de Amazon Redshift mediante las métricas de CloudWatch - Amazon Redshift

Monitoreo de Amazon Redshift mediante las métricas de CloudWatch

Con las métricas de CloudWatch para Amazon Redshift, puede obtener información acerca del rendimiento y el estado del clúster y ver los datos en el nivel del nodo. Al trabajar con estas métricas, hay que recordar que cada métrica tiene una o más dimensiones asociadas. Estas dimensiones le indican a qué se puede aplicar la métrica; es decir, el alcance de la métrica. Amazon Redshift tiene las dos dimensiones siguientes:

  • Las métricas que tienen una dimensión NodeID son métricas que proporcionan los datos de rendimiento de los nodos de un clúster. Este conjunto de métricas incluye el nodo principal y los de computación. Entre los ejemplos de estas métricas se incluyen CPUUtilization, ReadIOPS y WriteIOPS.

  • Las métricas que tienen solo una dimensión ClusterIdentifier son métricas que proporcionan datos de rendimiento de los clústeres. Entre los ejemplos de estas métricas se incluyen HealthStatus y MaintenanceMode.

    nota

    En algunos casos de métricas, una métrica específica del clúster representa una acumulación del comportamiento de los nodos. En estos casos, hay que prestar especial atención al interpretar el valor de las métricas, ya que el comportamiento del nodo principal se agrega al del nodo de computación.

Para obtener más información acerca de las métricas y las dimensiones de CloudWatch, consulte Conceptos de CloudWatch en la Guía del usuario de Amazon CloudWatch.

Si desea obtener más detalles acerca de las métricas de CloudWatch para Amazon Redshift, consulte las siguientes secciones.

Métricas de Amazon Redshift

El espacio de nombres de AWS/Redshift incluye las siguientes métricas. A menos que se indique lo contrario, las métricas se recopilan en intervalos de 1 minuto.

Título
Métrica Descripción
CommitQueueLength

El número de transacciones en espera de confirmación en un momento determinado.

Unidades: recuento

Dimensiones: ClusterIdentifier

ConcurrencyScalingActiveClusters

El número de clústeres de escalado de simultaneidad que procesan activamente consultas en un momento dado.

Unidades: recuento

Dimensiones: ClusterIdentifier

ConcurrencyScalingSeconds

El número de segundos usados por los clústeres de escalado de simultaneidad que tienen actividad de procesamiento de consultasactivas.

Unidades: recuento

Dimensiones: ClusterIdentifier

CPUUtilization

El porcentaje de utilización de CPU. Para los clústeres, esta métrica representa la suma de los valores de utilización de CPU de todos los nodos (principales y de computación).

Unidades: porcentaje

Dimensiones: ClusterIdentifier, NodeID

Dimensiones: ClusterIdentifier

DatabaseConnections

El número de conexiones de base de datos a un clúster.

Unidades: recuento

Dimensiones: ClusterIdentifier

HealthStatus

Indica el estado del clúster. Cada minuto el clúster se conecta a su base de datos y realiza una consulta sencilla. Si puede realizar esta operación correctamente, se considera que el clúster está en buen estado. De lo contrario, se considera que el clúster está en mal estado. Un estado incorrecto se puede producir cuando la base de datos del clúster está sobrecargada en exceso o cuando hay un problema de configuración con una base de datos del clúster.

nota

En Amazon CloudWatch, esta métrica se registra como 1 o 0, mientras que, en la consola de Amazon Redshift, se muestra con las palabras HEALTHY o UNHEALTHY para facilitar su lectura. Cuando esta métrica se muestra en la consola de Amazon Redshift, se omiten los promedios de muestreo y solo se muestra HEALTHY o UNHEALTHY. En Amazon CloudWatch, pueden aparecer otros valores además de 0 y 1 por cuestiones de muestreo. Cualquier valor inferior a 1 para HealthStatus se registra como 0 (UNHEALTHY).

Unidades: recuento (1/0) (HEALTHY/UNHEALTHY en la consola de Amazon Redshift)

Dimensiones: ClusterIdentifier

MaintenanceMode

Indica si los datos del clúster se encuentran en modo de mantenimiento.

nota

En Amazon CloudWatch, esta métrica se registra como 1 o 0, mientras que, en la consola de Amazon Redshift, se muestra con las palabras ON o OFF para facilitar su lectura. Cuando esta métrica se muestra en la consola de Amazon Redshift, se omiten los promedios de muestreo y solo se muestra ON o OFF. En Amazon CloudWatch, pueden aparecer otros valores además de 0 y 1 por cuestiones de muestreo. Cualquier valor mayor que 0 para MaintenanceMode se registra como 1 (ON).

Unidades: recuento (1/0) (ON/OFF en la consola de Amazon Redshift).

Dimensiones: ClusterIdentifier

MaxConfiguredConcurrencyScalingClusters

El número máximo de clústeres de escalado de simultaneidad configurados desde el grupo de parámetros. Para obtener más información, consulte Grupos de parámetros de Amazon Redshift.

Unidades: recuento

Dimensiones: ClusterIdentifier

NetworkReceiveThroughput

La velocidad a la que el nodo o el clúster reciben datos.

Unidades: bytes/segundo (MB/s en la consola de Amazon Redshift)

Dimensiones: ClusterIdentifier, NodeID

Dimensiones: ClusterIdentifier

NetworkTransmitThroughput

La velocidad a la que el nodo o el clúster escriben datos.

Unidades: bytes/segundo (MB/s en la consola de Amazon Redshift)

Dimensiones: ClusterIdentifier, NodeID

Dimensiones: ClusterIdentifier

PercentageDiskSpaceUsed

El porcentaje del espacio en disco usado.

Unidades: porcentaje

Dimensiones: ClusterIdentifier

Dimensiones: ClusterIdentifier, NodeID

QueriesCompletedPerSecond

Promedio de consultas completadas por segundo. La información se envía en intervalos de 5 minutos. Esta métrica no se admite en los clústeres de un solo nodo.

Unidades: recuento/segundo

Dimensiones: ClusterIdentifier, latency

Dimensiones: ClusterIdentifier, wlmid

QueryDuration

Tiempo medio que tarda en completarse una consulta. La información se envía en intervalos de 5 minutos. Esta métrica no se admite en los clústeres de un solo nodo.

Unidades: microsegundos

Dimensiones: ClusterIdentifier, NodeID, latency

Dimensiones: ClusterIdentifier, latency

Dimensiones: ClusterIdentifier, NodeID, wlmid

QueryRuntimeBreakdown

El tiempo total que las consultas dedican a ejecutarse por etapa de consulta. La información se envía en intervalos de 5 minutos.

Unidades: milisegundos

Dimensiones: ClusterIdentifier, NodeID, etapa

Dimensiones: ClusterIdentifier, etapa

ReadIOPS

El número medio de operaciones de lectura en disco por segundo.

Unidades: recuento/segundo

Dimensiones: ClusterIdentifier, NodeID

Dimensiones: ClusterIdentifier

ReadLatency

Tiempo medio de cada operación de E/S de lectura en disco.

Unidades: segundos

Dimensiones: ClusterIdentifier, NodeID

Dimensiones: ClusterIdentifier

ReadThroughput

El número medio de bytes leídos del disco por segundo.

Unidades: bytes (GB/s en la consola de Amazon Redshift)

Dimensiones: ClusterIdentifier, NodeID

Dimensiones: ClusterIdentifier

RedshiftManagedStorageTotalCapacity

Capacidad total de almacenamiento administrado.

Unidades: megabytes

Dimensiones: ClusterIdentifier

TotalTableCount

Número de tablas de usuario abiertas en un momento determinado. Este total no incluye tablas de Amazon Redshift Spectrum.

Unidades: recuento

Dimensiones: ClusterIdentifier

WLMQueueLength

El número de consultas en la cola para una cola de administración de carga de trabajo (WLM).

Unidades: recuento

Dimensiones: ClusterIdentifier, service class

Dimensiones: ClusterIdentifier, QueueName

WLMQueueWaitTime

El tiempo de consultas invertido en esperar en la cola de administración de carga de trabajo (WLM). La información se envía en intervalos de 5 minutos.

Unidades: milisegundos.

Dimensiones: ClusterIdentifier, QueryPriority

Dimensiones: ClusterIdentifier, wlmid

Dimensiones: ClusterIdentifier, QueueName

WLMQueriesCompletedPerSecond

Número medio de consultas completadas por segundo en una cola de administración de carga de trabajo (WLM). La información se envía en intervalos de 5 minutos. Esta métrica no se admite en los clústeres de un solo nodo.

Unidades: recuento/segundo

Dimensiones: ClusterIdentifier, wlmid

Dimensiones: ClusterIdentifier, QueueName

WLMQueryDuration

Tiempo medio que tarda en completarse una consulta en una cola de administración de carga de trabajo (WLM). La información se envía en intervalos de 5 minutos. Esta métrica no se admite en los clústeres de un solo nodo.

Unidades: microsegundos

Dimensiones: ClusterIdentifier, wlmid

Dimensiones: ClusterIdentifier, QueueName

WLMRunningQueries

El número de consultas que se ejecutan desde el clúster principal y el clúster de escalado de simultaneidad por cola de WLM.

Unidades: recuento

Dimensiones: ClusterIdentifier, wlmid

Dimensiones: ClusterIdentifier, QueueName

WriteIOPS

El número medio de operaciones de escritura en disco por segundo.

Unidades: recuento/segundo

Dimensiones: ClusterIdentifier, NodeID

Dimensiones: ClusterIdentifier

WriteLatency

Tiempo medio de cada operación de E/S de escritura en disco.

Unidades: segundos

Dimensiones: ClusterIdentifier, NodeID

Dimensiones: ClusterIdentifier

WriteThroughput

Número medio de bytes que se escriben en el disco por segundo.

Unidades: bytes (GB/s en la consola de Amazon Redshift)

Dimensiones: ClusterIdentifier, NodeID

Dimensiones: ClusterIdentifier

SchemaQuota

La cuota configurada para un esquema.

Unidades: megabytes

Dimensiones: ClusterIdentifier, Database, Schema

Periódica/push: Periodic

Frecuencia: 5 minutes

Criterios de detención: esquema eliminado o cuota eliminada

NumExceededSchemaQuotas

El número de esquemas con cuotas superadas.

Unidades: recuento

Dimensiones: ClusterIdentifier

Periódica/push: Periodic

Frecuencia: 5 minutes

Criterios de detención: N/A

StorageUsed

El espacio de almacenamiento o disco utilizado por un esquema.

Unidades: megabytes

Dimensiones: ClusterIdentifier, Database, Schema

Periódica/push: Periodic

Frecuencia: 5 minutes

Criterios de detención: esquema eliminado o cuota eliminada

PercentageQuotaUsed

El porcentaje de espacio de almacenamiento o disco utilizado en relación con la cuota de esquema configurada.

Unidades: porcentaje

Dimensiones: ClusterIdentifier, Database, Schema

Periódica/push: Periodic

Frecuencia: 5 minutes

Criterios de detención: esquema eliminado o cuota eliminada

UsageLimitAvailable

Según el FeatureType, UsageLimitAvailable devuelve lo siguiente:

  • Si el FeatureType es CONCURRENCY_SCALING, UsageLimitAvailable devuelve la cantidad total de tiempo que puede utilizar el escalado simultáneo en incrementos de 1 minuto.

  • Si el FeatureType es CROSS_REGION_DATASHARING, UsageLimitAvailable devuelve la cantidad total de datos que se puede escanear en incrementos de 1 minuto.

  • Si el FeatureType es SPECTRUM, UsageLimitAvailable devuelve la cantidad total de datos que se puede escanear en incrementos de 1 minuto.

Unidades: minutos o TB

Dimensiones: ClusterIdentifier, FeatureType, UsageLimitId

UsageLimitConsumed

Según el FeatureType, UsageLimitConsumed devuelve lo siguiente:

  • Si el FeatureType es CONCURRENCY_SCALING, UsageLimitAvailable devuelve la cantidad total de tiempo que utiliza el escalado simultáneo en incrementos de 1 minuto.

  • Si el FeatureType es CROSS_REGION_DATASHARING, UsageLimitAvailable devuelve la cantidad total de datos escaneada en incrementos de 1 minuto.

  • Si el FeatureType es SPECTRUM, UsageLimitAvailable devuelve la cantidad total de datos escaneada en incrementos de 1 minuto.

Unidades: minutos o TB

Dimensiones: ClusterIdentifier, FeatureType, UsageLimitId

Dimensiones de métricas de Amazon Redshift

Los datos de Amazon Redshift se pueden filtrar con algunas de las dimensiones de la tabla siguiente.

Dimensión Descripción
latency

Los valores posibles son los siguientes:

  • corta: menos de 10 segundos

  • mediana: entre 10 segundos y 10 minutos

  • larga: más de 10 minutos

NodeID

Filtra los datos solicitados que son específicos de los nodos de un clúster. NodeID puede ser "Leader (Principal)", "Shared (Compartido)", o "Compute-N (N-computación)", donde N puede ser 0, 1, etc. en función del número de nodos del clúster. "Shared" significa que el clúster tiene un solo nodo, es decir, que el nodo principal y el nodo de computación están combinados.

Las métricas de CPUUtilization, NetworkTransmitThroughput y ReadIOPS se registran únicamente para el nodo principal y los nodos de computación. Otras métricas que usan la dimensión NodeId se registran solo para los nodos de computación.

ClusterIdentifier

Filtra los datos solicitados que son específicos del clúster. Las métricas específicas del clúster son HealthStatus, MaintenanceMode y DatabaseConnections. Las métricas generales de esta dimensión (por ejemplo, ReadIOPS), que también son métricas de nodos, representan el total acumulado de datos de métricas de nodos. Preste especial atención cuando interprete estas métricas, ya que incluyen el comportamiento acumulado tanto del nodo principal como de los nodos de computación.

service class

El identificador de una clase de servicio WLM.

stage

Fases de ejecución de una consulta. Los valores posibles son los siguientes:

  • QueryPlanning: tiempo invertido en procesar y optimizar instrucciones SQL.

  • QueryWaiting: tiempo invertido en esperar en la cola de WLM.

  • QueryExecutingRead: tiempo invertido en ejecutar consultas de lectura.

  • QueryExecutingInsert: tiempo invertido en ejecutar consultas de inserción.

  • QueryExecutingDelete: tiempo invertido en ejecutar consultas de eliminación.

  • QueryExecutingUpdate: tiempo invertido en ejecutar consultas de actualización.

  • QueryExecutingCtas: tiempo invertido en ejecutar consultas CREATE TABLE AS.

  • QueryExecutingUnload: tiempo invertido en ejecutar consultas de descarga.

  • QueryExecutingCopy: tiempo invertido en ejecutar consultas de copia.

  • QueryCommit: tiempo invertido en confirmar operaciones.

wlmid

Es el identificador de una cola de administración de carga de trabajo.

QueryPriority

La prioridad de la consulta. Los valores posibles son CRITICAL, HIGHEST, HIGH, NORMAL, LOW y LOWEST.

QueueName

El nombre de la cola de administración de cargas de trabajo.

FeatureType

La característica que está limitada por un límite de uso. Los posibles valores son CONCURRENCY_SCALING, CROSS_REGION_DATASHARING y SPECTRUM.

UsageLimitId

El identificador del límite de uso.

Datos de rendimiento de cargas y consultas de Amazon Redshift

Además de las métricas de CloudWatch, Amazon Redshift proporciona datos de rendimiento de cargas y consultas. Los datos de rendimiento de cargas y consultas se pueden utilizar para ayudarle a comprender la relación entre el rendimiento de la base de datos y las métricas de clúster. Por ejemplo, si observa que la CPU de un clúster alcanzo su pico, puede encontrar el pico en el gráfico de CPU del clúster y ver las consultas que se estaban ejecutando en ese momento. De igual forma, si está revisando una consulta específica, los datos de métricas (como los de CPU) se muestran en contexto para que pueda comprender el impacto de la consulta en las métricas de clúster.

Los datos de rendimiento de cargas y consultas no se publican como las métricas de CloudWatch y solo pueden verse en la consola de Amazon Redshift. Los datos de rendimiento de cargas y consultas se generan a partir de consultas de las tablas de sistema de la base de datos (para obtener más información, consulte Referencia de las tablas de sistema en la Guía para desarrolladores de Amazon Redshift). También puede generar sus propias consultas personalizadas de rendimiento de la base de datos, pero recomendamos comenzar con los datos de rendimiento de cargas y consultas que se presentan en la consola. Para obtener más información acerca de la medición y el monitoreo del rendimiento de la base de datos, consulte Administración del rendimiento en la Guía para desarrolladores de Amazon Redshift.

En la siguiente tabla, se describen los diferentes aspectos de los datos de cargas y consultas a los que puede obtener acceso en la consola de Amazon Redshift.

Datos de cargas/consultas Descripción
Resumen de consultas

Lista de consultas en un período de tiempo específico. La lista se puede ordenar por valores como el ID de consulta, tiempo de ejecución de la consulta y el estado. Consulte estos datos en la pestaña Monitoreo de consultas de la página de detalles del clúster.

Detalle de consulta

Proporciona detalles de una consulta en particular, incluidos:

  • Las propiedades de la consulta como el ID de consulta, el tipo, el clúster en el que se ejecutó la consulta y el tiempo de ejecución.

  • Detalles como el estado de consulta y el número de errores.

  • La instrucción SQL que se ejecutó.

  • Un plan de explicación, si está disponible.

  • Datos de rendimiento del clúster durante la ejecución de la consulta (para obtener más información, consulte Visualización de datos del historial de consultas).

Resumen de cargas

Muestra todas las cargas en un período de tiempo específico. La lista se puede ordenar por valores como el ID de consulta, tiempo de ejecución de la consulta y el estado. Consulte estos datos en la pestaña Monitoreo de consultas de la página de detalles del clúster.

Detalle de carga

Proporciona detalles de una operación de carga en particular, incluidos:

  • Las propiedades de la carga, como el ID de consulta, el tipo, el clúster en el que se ejecutó la consulta y el tiempo de ejecución.

  • Detalles como el estado de carga y el número de errores.

  • La instrucción SQL que se ejecutó.

  • Una lista de archivos cargados.

  • Datos de rendimiento del clúster durante la operación de carga (para obtener más información, consulte Visualización de datos del historial de consultas).