Métricas de Amazon SQS Colas de cartas muertas () y métricas DLQs CloudWatch Colas y métricas justas CloudWatch Dimensiones para las métricas de Amazon SQS Consejos de supervisión

CloudWatch Métricas disponibles para Amazon SQS

Amazon SQS envía las siguientes métricas a. CloudWatch

nota

En el caso de algunas métricas, el resultado es aproximado debido a la arquitectura distribuida de Amazon SQS. En la mayoría de los casos, el recuento debe aproximarse al número real de mensajes de la cola.

Métricas de Amazon SQS

Amazon SQS publica automáticamente las métricas operativas en Amazon en el AWS/SQS espacio de CloudWatch nombres. Estas métricas le ayudan a supervisar el estado y el rendimiento de las colas. Debido a la naturaleza distribuida de SQS, muchos valores son aproximados, pero lo suficientemente precisos para la mayoría de las decisiones operativas.

nota

Todas las métricas emiten valores no negativos solo cuando la cola está activa.
Algunas métricas (por ejemploSentMessageSize) no se emiten hasta que se envía al menos un mensaje.

Métrica	Descripción	Unidades	Informar sobre el comportamiento	Notas clave
`ApproximateAgeOfOldestMessage`	La antigüedad del mensaje sin procesar más antiguo de la lista.	Segundos	Se informa si la cola contiene al menos un mensaje activo.	En las colas estándar, si un mensaje se recibe tres o más veces y no se elimina, SQS lo mueve al final de la cola. A continuación, la métrica refleja la antigüedad del siguiente mensaje que no ha superado el umbral de recepción. Este reordenamiento se produce incluso cuando existe una política de retransmisión. Los mensajes envenenados (los que se reciben repetidamente pero nunca se eliminan) se excluyen de esta métrica hasta que se procesen correctamente. Cuando un mensaje se traslada a un DLQ después de superar el valor`maxReceiveCount`, la antigüedad se restablece. En ese caso, la métrica del DLQ refleja la hora a la que se trasladó el mensaje, no cuándo se envió originalmente. Las colas FIFO no reordenan los mensajes para mantener el orden. Un mensaje fallido bloquea su grupo de mensajes hasta que se elimine o caduque. Si se configura un DLQ, el mensaje se envía allí cuando se alcanza el umbral de recepción.
`ApproximateNumberOfGroupsWithInflightMessages`	Solo para FIFO. El número de grupos de mensajes con uno o más mensajes en movimiento.	Recuento	Se informa si la cola FIFO está activa.	Se considera que un mensaje está en curso cuando un consumidor lo ha recibido de la cola, pero que aún no ha sido eliminado o ha caducado. Esta métrica te ayuda a solucionar problemas y a optimizar el rendimiento de las colas FIFO. Los valores altos suelen indicar una gran simultaneidad. Si la cola tiene una gran cantidad de pedidos pendientes y este valor sigue siendo bajo, considere la posibilidad de ampliar el número de consumidores o aumentar el número de grupos de mensajes activos. Para conocer los límites de rendimiento y durante el vuelo, consulte. Cuotas de Amazon SQS
`ApproximateNumberOfMessagesDelayed`	El número de mensajes de la cola que están retrasados y que no están disponibles de forma inmediata para su recuperación.	Recuento	Se informa si hay mensajes retrasados en la cola.	Se aplica a las colas configuradas con un retraso predeterminado y a los mensajes individuales enviados con un `DelaySeconds` parámetro. Los mensajes retrasados permanecen ocultos para los consumidores hasta que vence su período de retraso, lo que puede afectar a la acumulación de colas percibidas o al rendimiento.
`ApproximateNumberOfMessagesNotVisible`	El número de mensajes durante el vuelo que se han recibido pero que aún no se han eliminado o que han caducado.	Recuento	Se informa si existen mensajes durante el vuelo.	Los mensajes entran en estado de vuelo tras enviarse a un consumidor a través de la `ReceiveMessage`API. Estos mensajes se ocultan temporalmente a otros consumidores durante el tiempo de espera de visibilidad. Usa esta métrica para hacer un seguimiento de los retrasos en el procesamiento de los mensajes o de los consumidores atrapados.
`ApproximateNumberOfMessagesVisible`	El número de mensajes actualmente disponibles para su recuperación y procesamiento.	Recuento	Se informa si la cola está activa.	Refleja la acumulación de procesamiento actual en la cola. No hay un límite estricto en cuanto al número de mensajes que se pueden acumular, pero están sujetos al período de retención configurado en la cola. Un valor alto y constante puede indicar que los consumidores están insuficientemente aprovisionados o que la lógica de procesamiento está atascada.
`NumberOfEmptyReceives`¹	El número de llamadas a la ReceiveMessageAPI que no devolvieron ningún mensaje.	Recuento	Se notificó durante las operaciones de recepción.	Esta métrica puede ayudar a identificar las ineficiencias en el comportamiento de las encuestas o los casos de consumo infrautilizados. Los valores altos se pueden producir cuando la cola está vacía, el consumidor utiliza sondeos cortos o los mensajes se procesan más rápido de lo que se producen. Este no es un indicador preciso del estado de la cola. Refleja el comportamiento del servicio y puede incluir reintentos.
`NumberOfDeduplicatedSentMessages`	Solo para FIFO. El número de mensajes enviados que se deduplicaron y no se agregaron a la cola.	Recuento	Se informa si se detectan `MessageDeduplicationId` valores o contenido duplicados.	SQS deduplica los mensajes en función del hash `MessageDeduplicationId` o del contenido (si está activado). Un valor alto puede indicar que un productor envía repetidamente el mismo mensaje dentro del período de deduplicación de 5 minutos. Utilice esta métrica para solucionar problemas de lógica redundante del productor o para confirmar que la deduplicación funciona según lo previsto.
`NumberOfMessagesDeleted`¹	El número de mensajes borrados correctamente de la cola.	Recuento	Se informa de cada solicitud de eliminación con un identificador de recibo válido.	Esta métrica cuenta todas las operaciones de eliminación que se han realizado correctamente, incluso si el mismo mensaje se ha eliminado más de una vez. Los motivos más comunes de los higher-than-expected valores son los siguientes: Se eliminan varias veces el mismo mensaje con distintos identificadores de recepción, una vez transcurrido el tiempo de espera de visibilidad y el mensaje se vuelve a recibir. Las eliminaciones se duplican con el mismo identificador de recibo, lo que, aun así, devuelve el estado correcto y aumenta la métrica. Usa esta métrica para realizar un seguimiento del éxito del procesamiento de los mensajes, pero no la trates como un recuento exacto de mensajes eliminados únicos.
`NumberOfMessagesReceived`¹	El número de mensajes devueltos por la ReceiveMessageAPI.	Recuento	Se informa durante las operaciones de recepción.	Esto incluye todos los mensajes devueltos a los consumidores, incluidos los que posteriormente se devuelven a la cola debido a la caducidad del tiempo de espera de visibilidad. Un solo mensaje se puede recibir varias veces si no se elimina, lo que puede provocar que esta métrica supere el número de mensajes enviados. Utilízala para realizar un seguimiento de la actividad de los consumidores, pero no la trates como un recuento de mensajes únicos procesados.
`NumberOfMessagesSent`¹	El número de mensajes que se han añadido correctamente a una cola.	Recuento	Se notifica por cada envío manual realizado correctamente.	Las llamadas manuales realizadas `SendMessage` o `SendMessageBatch` contabilizadas, incluidas las que se dirigen directamente a un DLQ. Los mensajes que se transfieren automáticamente a un DLQ después de superar el límite no `maxReceiveCount` se incluyen en esta métrica. Como resultado, `NumberOfMessagesSent` puede ser inferior a, `NumberOfMessagesReceived` especialmente si las políticas de redrive están trasladando muchos mensajes a un segundo plano DLQs .
`SentMessageSize`¹	El tamaño de los mensajes enviados correctamente a la cola.	Bytes	No se emite hasta que se envíe al menos un mensaje.	Esta métrica no aparecerá en la CloudWatch consola hasta que la cola reciba su primer mensaje. Utilice esta métrica para realizar un seguimiento del tamaño de cada mensaje en bytes. Esto resulta útil para analizar las tendencias de la carga útil o estimar el costo del rendimiento. El tamaño máximo de mensaje para SQS es de 1 MiB.
`ApproximateNumberOfNoisyGroups`	El número de grupos de mensajes que se consideran ruidosos en una cola regular. Un grupo de mensajes ruidoso representa a un inquilino vecino ruidoso de una cola de varios usuarios.	Recuento	Si la cola está activa, se informa de un valor no negativo.	Ayuda a identificar posibles problemas de vecinos ruidosos en entornos con varios usuarios mediante el seguimiento de los grupos de mensajes que consumen recursos desproporcionados. Utilice esta métrica para configurar alarmas que se activen cuando el número de grupos ruidosos supere el umbral aceptable, lo que indica posibles problemas de equilibrio en las colas.
`ApproximateNumberOfMessagesVisibleInQuietGroups`	El número de mensajes visibles, excluyendo los mensajes de grupos de mensajes ruidosos.	Recuento	Si la cola está activa, se informa de un valor no negativo.	Proporciona visibilidad de la acumulación de colas para los grupos de mensajes con velocidad estándar, excluyendo los mensajes de vecinos ruidosos. Ayuda a identificar el verdadero retraso en el procesamiento de los grupos de mensajes típicos al filtrar el impacto de los vecinos ruidosos.
`ApproximateNumberOfMessagesNotVisibleInQuietGroups`	El número de mensajes en movimiento, excluidos los mensajes de grupos de mensajes ruidosos.	Recuento	Si la cola está activa, se indica un valor no negativo.	Realiza un seguimiento de los mensajes en movimiento (que se están procesando pero aún no se han eliminado) de grupos de mensajes que se comportan bien. Utilice esta métrica para supervisar el rendimiento del procesamiento de los grupos de mensajes normales y detectar los cuellos de botella en el procesamiento que no se deben a vecinos ruidosos.
`ApproximateNumberOfMessagesDelayedInQuietGroups`	El número de mensajes, excepto los mensajes de grupos de mensajes ruidosos que se retrasan y no están disponibles para su lectura inmediata. Los mensajes retrasados se producen cuando la cola está configurada como cola de retraso o cuando se envía un mensaje con un parámetro de retraso.	Recuento	Si la cola está activa, se informa de un valor no negativo.	Ayuda a controlar el retraso en la acumulación de mensajes de los grupos de mensajes con patrones de rendimiento normales o esperados (a diferencia de los grupos ruidosos o de gran volumen) Útil para comprender los requisitos de procesamiento futuros y la planificación de la capacidad para cargas de trabajo típicas.
`ApproximateAgeOfOldestMessageInQuietGroups`	La antigüedad del mensaje no eliminado más antiguo de la cola, excluidos los mensajes de grupos de mensajes ruidosos.	Segundos	Si la cola está activa, se indica un valor no negativo.	Se utiliza para supervisar el cumplimiento del SLA y detectar cuellos de botella en el procesamiento en grupos de mensajes con patrones de rendimiento normales o esperados (a diferencia de los grupos de mensajes ruidosos o de gran volumen que, de otro modo, podrían sesgar la métrica). Utilice esta métrica para configurar alarmas cuando se agoten los tiempos de espera del procesamiento de los mensajes e ignorar los mensajes envejecidos artificialmente procedentes de vecinos ruidosos.

¹ Estas métricas reflejan la actividad a nivel del sistema y pueden incluir reintentos, duplicados o mensajes retrasados. No utilices recuentos brutos para estimar el estado de las colas en tiempo real sin tener en cuenta el comportamiento del ciclo de vida de los mensajes.

Colas de cartas muertas () y métricas DLQs CloudWatch

Al trabajar con ellas DLQs, es importante entender cómo se comportan las métricas de Amazon SQS:

NumberOfMessagesSent— Esta métrica se comporta de forma diferente para: DLQs
- Envío manual: esta métrica captura los mensajes que se envían manualmente a un DLQ.
- Retransmisión automática: esta métrica no captura los mensajes que se mueven automáticamente a un DLQ debido a errores de procesamiento. Como resultado, es posible que las NumberOfMessagesReceived métricas NumberOfMessagesSent y muestren discrepancias para. DLQs
Métrica recomendada para DLQs: para monitorear el estado de una DLQ, usa la ApproximateNumberOfMessagesVisible métrica. Esta métrica indica el número de mensajes actualmente disponibles para su procesamiento en el DLQ.

Colas y métricas justas CloudWatch

Cuando utiliza colas justas, Amazon SQS emite las siguientes métricas adicionales:

ApproximateNumberOfNoisyGroups
ApproximateNumberOfMessagesVisibleInQuietGroups
ApproximateNumberOfMessagesNotVisibleInQuietGroups
ApproximateNumberOfMessagesDelayedInQuietGroups
ApproximateAgeOfOldestMessageInQuietGroups

nota

Cada QuietGroup métrica es un subconjunto de la métrica estándar equivalente a nivel de cola, pero excluye los mensajes de grupos Approximate vecinos ruidosos.

Grupos ruidosos: Un grupo de mensajes ruidoso representa a un inquilino vecino ruidoso de una cola de varios inquilinos.
Grupos silenciosos: Grupos de mensajes, excluidos los grupos ruidosos.

Observar el comportamiento de SQS en las colas justas

Para monitorizar el efecto de las colas de espera en las ferias de Amazon SQS, puede comparar las Approximate..InQuietGroups métricas con las métricas estándar a nivel de cola. Durante los picos de tráfico de un usuario específico, las métricas generales a nivel de cola pueden revelar el aumento de los atrasos o la antigüedad de los mensajes. Sin embargo, si analizas los grupos silenciosos de forma aislada, puedes identificar que la mayoría de los grupos o inquilinos de mensajes que no son ruidosos no se ven afectados y proporcionar una estimación del número total de grupos de mensajes afectados.

Si bien estas nuevas métricas ofrecen una buena visión general del comportamiento de Amazon SQS en las colas justas, puede resultar útil saber qué inquilino específico está causando la carga. Amazon CloudWatch Contributor Insights te permite ver métricas sobre los N principales colaboradores, el número total de colaboradores únicos y su uso. Esto resulta especialmente útil en situaciones en las que se trata de miles de inquilinos que, de otro modo, generarían datos de gran cardinalidad (y costes) al emitir las métricas tradicionales.

Para ver un ejemplo de la configuración de supervisión de las colas de espera en ferias, consulte el ejemplo siguiente. GitHub

Dimensiones para las métricas de Amazon SQS

Las métricas de Amazon SQS se CloudWatch utilizan en una sola dimensión:. QueueName Todos los datos de las métricas se agrupan y filtran por el nombre de la cola.

Consejos de supervisión

Supervise el SQS de forma eficaz mediante métricas y CloudWatch alarmas clave para detectar las colas acumuladas, optimizar el rendimiento y mantenerse dentro de los límites del servicio.

Establezca CloudWatch alarmas en función del crecimiento ApproximateNumberOfMessagesVisible de los atrasos para atrapar.
NumberOfEmptyReceivesSupervise para ajustar la frecuencia de las encuestas y reducir el costo de la API.
Úselo ApproximateNumberOfGroupsWithInflightMessages en las colas FIFO para diagnosticar los límites de rendimiento.
Revise las cuotas de SQS para comprender los umbrales métricos y los límites de servicio.

Aviso JavaScript está desactivado o no está disponible en su navegador.

Para utilizar la documentación de AWS, debe estar habilitado JavaScript. Para obtener más información, consulte las páginas de ayuda de su navegador.

Convenciones del documento

Creación de CloudWatch alarmas para las métricas de Amazon SQS

Validación de conformidad