¿Qué métricas debo monitorear? - Amazon ElastiCache (RedisOSS)

Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.

¿Qué métricas debo monitorear?

Las siguientes CloudWatch métricas ofrecen una buena visión ElastiCache del rendimiento. En la mayoría de los casos, le recomendamos que configure CloudWatch alarmas para estas métricas, de modo que pueda tomar medidas correctivas antes de que se produzcan problemas de rendimiento.

CPUUtilization

Se trata de una métrica de nivel de host que muestra un valor como un porcentaje. Para obtener más información, consulte Métricas de nivel de host.

En los tipos de nodos pequeños que tienen dos CPU virtuales o menos, utilice la métrica CPUUtilization para monitorear la carga de trabajo.

En general, sugerimos que establezca el umbral en el 90 % del ancho de banda de la CPU disponible. Como Redis OSS es de un solo subproceso, el valor umbral real debe calcularse como una fracción de la capacidad total del nodo. Por ejemplo, supongamos que está usando un tipo de nodo con dos núcleos. En este caso, el umbral de CPUUtilization sería de 90/2, es decir, el 45 %.

Deberá determinar su propio umbral en función del número de núcleos del nodo de caché que use. Si supera este umbral y su carga de trabajo principal es de solicitudes de lectura, escale el clúster de caché de forma ascendente agregando réplicas de lectura. Si la carga de trabajo principal es de solicitudes de escritura, en función de la configuración del clúster, recomendamos que:

  • Clústeres de Redis OSS (modo de clúster desactivado): se amplían mediante un tipo de instancia de caché más grande.

  • Clústeres de Redis OSS (modo de clúster activado): añada más fragmentos para distribuir la carga de trabajo de escritura entre más nodos principales.

sugerencia

En lugar de utilizar la métrica a nivel de hostCPUUtilization, los usuarios de Redis OSS podrían utilizar la métrica Redis OSSEngineCPUUtilization, que indica el porcentaje de uso en el núcleo del motor de Redis OSS. Para comprobar si esta métrica está disponible en sus nodos y obtener más información, consulte Métricas de Redis OSS.

Para los tipos de nodos más grandes con 4 vCPU o más, puede utilizar la EngineCPUUtilization métrica, que indica el porcentaje de uso en el núcleo del motor OSS de Redis. Para comprobar si esta métrica está disponible en sus nodos y obtener más información, consulte Métricas de Redis OSS.

EngineCPUUtilization

Para los tipos de nodos más grandes con 4 vCPU o más, puede utilizar la EngineCPUUtilization métrica, que indica el porcentaje de uso en el núcleo del motor OSS de Redis. Para comprobar si esta métrica está disponible en sus nodos y obtener más información, consulte Métricas de Redis OSS.

Para obtener más información, consulte la sección CPU en Supervisión de las mejores prácticas con Amazon ElastiCache (Redis OSS) mediante Amazon. CloudWatch

SwapUsage

Se trata de una métrica de nivel de host que muestra un valor en bytes. Para obtener más información, consulte Métricas de nivel de host.

Una FreeableMemory CloudWatch métrica cercana a 0 (es decir, inferior a 100 MB) o una SwapUsage métrica superior a la FreeableMemory métrica indica que un nodo está bajo presión de memoria. Si esto sucede, consulte los siguientes temas:

Evictions

Es una métrica del motor de la caché Recomendamos que determine su propio umbral de alarma para esta métrica en función de las necesidades de su aplicación.

CurrConnections

Es una métrica del motor de la caché Recomendamos que determine su propio umbral de alarma para esta métrica en función de las necesidades de su aplicación.

Un número creciente de CurrConnectionspodría indicar un problema con la aplicación; tendrá que investigar el comportamiento de la aplicación para solucionar este problema.

Para obtener más información, consulte la sección Conexiones en Supervisión de las mejores prácticas con Amazon ElastiCache (Redis OSS) mediante Amazon CloudWatch.

Memoria

La memoria es un aspecto fundamental de Redis OSS. Es necesario comprender la utilización de la memoria de un clúster para evitar la pérdida de datos y adaptarse al crecimiento futuro del conjunto de datos. Las estadísticas sobre la utilización de la memoria de un nodo están disponibles en la sección de memoria del comando INFO OSS de Redis.

Para obtener más información, consulte la sección Memoria en Supervisión de las mejores prácticas con Amazon ElastiCache (Redis OSS) mediante Amazon CloudWatch.

Network

Uno de los factores determinantes de la capacidad de la banda ancha de red del clúster es el tipo de nodo seleccionado. Para obtener más información sobre la capacidad de red de tu nodo, consulta los ElastiCache precios de Amazon.

Para obtener más información, consulte la sección Red en Supervisión de las mejores prácticas con Amazon ElastiCache (Redis OSS) mediante Amazon CloudWatch.

Latencia

Puede medir la latencia de un comando con un conjunto de CloudWatch métricas que proporcionan latencias agregadas por estructura de datos. Estas métricas de latencia se calculan mediante la commandstats estadística del comando OSS INFO de Redis.

Para obtener más información, consulte la sección Latencia en Supervisión de las mejores prácticas con Amazon ElastiCache (Redis OSS) mediante Amazon CloudWatch.

Replicación

El volumen de datos que se replican es visible a través de la métrica ReplicationBytes. Aunque esta métrica representa la carga de escritura del grupo de replicación, no proporciona información acerca del estado de replicación. Para este propósito, puede utilizar la métrica ReplicationLag.

Para obtener más información, consulte la sección Replicación en Supervisión de las mejores prácticas con Amazon ElastiCache (Redis OSS) mediante Amazon CloudWatch.

Administración del tráfico

ElastiCache (Redis OSS) gestiona automáticamente el tráfico de un nodo cuando se envían al nodo más comandos entrantes de los que puede procesar Redis OSS. Esto se hace para mantener un funcionamiento y una estabilidad óptimos del motor.

Cuando el tráfico se administra activamente en un nodo, la métrica TrafficManagementActive emite puntos de datos de 1. Esto indica que el nodo ha disminuido la escala para la carga de trabajo que se proporciona. Si esta métrica sigue siendo 1 durante largos periodos de tiempo, evalúe el clúster para decidir si es necesario escalar verticalmente o escalar horizontalmente.

Para obtener más información, consulte la métrica TrafficManagementActive en la página Métricas.