Monitoreo de Step Functions con CloudWatch - AWS Step Functions

Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.

Monitoreo de Step Functions con CloudWatch

La monitorización es una parte importante del mantenimiento de la fiabilidad, la disponibilidad y el rendimiento de AWS Step Functions y sus soluciones de AWS. Para que le resulte más sencillo depurar los errores que se producen en distintas partes del código, debe recopilar la mayor cantidad posible de datos de monitorización de los servicios de AWS que utilice. Antes de empezar la monitorización de Step Functions, debe crear un plan de monitorización que responda a las siguientes preguntas:

  • ¿Cuáles son los objetivos de la monitorización?

  • ¿Qué recursos va a monitorizar?

  • ¿Con qué frecuencia va a monitorizar estos recursos?

  • ¿Qué herramientas de monitoreo va a utilizar?

  • ¿Quién se encargará de realizar las tareas de monitoreo?

  • ¿Quién debería recibir una notificación cuando surjan problemas?

El siguiente paso consiste en establecer una línea de referencia para el rendimiento normal de Step Functions en su entorno. Para ello, mida el rendimiento en diversas ocasiones y con diferentes condiciones de carga. Cuando monitorice Step Functions, guarde los datos históricos de monitorización. Estos datos pueden servirle como referencia para compararlos con los datos de rendimiento actuales, para identificar los patrones de rendimiento normales y las anomalías del rendimiento, y para idear métodos de solución de problemas.

Por ejemplo, con Step Functions, puede supervisar cuántas actividades oAWS LambdaLas tareas de errores porque se ha agotado el tiempo de espera del latido. Si el rendimiento se sale de la referencia establecida, es posible que tenga que cambiar el intervalo de latidos.

Para establecer un punto de referencia debe, como mínimo, monitorizar las siguientes métricas:

  • ActivitiesStarted

  • ActivitiesTimedOut

  • ExecutionsStarted

  • ExecutionsTimedOut

  • LambdaFunctionsStarted

  • LambdaFunctionsTimedOut

En las secciones siguientes, se describen las métricas que Step Functions proporciona a Amazon CloudWatch. Puede utilizarlas para supervisar las máquinas de estado y las actividades, así como para establecer alarmas en los valores que actúan como umbral. Puede consultar las métricas utilizando la AWS Management Console.

Métricas que registran un intervalo de tiempo

Algunas de las métricas de Step Functions CloudWatch son:intervalos de tiempo, que siempre se mide en milisegundos. Estas métricas, por lo general, se corresponden con fases de ejecución en las que puede definir tiempos de espera para las máquinas de estado, las actividades y las funciones Lambda, utilizando nombres descriptivos.

Por ejemplo, la métrica ActivityRunTime mide el tiempo que tarda una actividad en completarse una vez que comienza su ejecución Puede establecer un tiempo de espera con este mismo período de tiempo.

En la consola de CloudWatch, obtendrá mejores resultados si selecciona average como la estadística que debe aparecer con las métricas de intervalo de tiempo.

Métricas que registran un recuento

Algunas de las métricas de CloudWatch para Step Functions registran los resultados enconteo. Por ejemplo, ExecutionsFailed registra el número o recuento de ejecuciones con errores de la máquina de estado.

En la consola de CloudWatch, obtendrá mejores resultados si selecciona sum como la estadística que debe aparecer con las métricas de recuento.

Métricas de ejecución

LaAWS/StatesEl espacio de nombres incluye las siguientes métricas para las ejecuciones de Step Functions.

Métrica Descripción
ExecutionTime El intervalo, en milisegundos, entre el momento en que se inicia la ejecución y el momento en que se cierra.
ExecutionThrottled El número de eventos StateEntered y de reintentos que han sido objeto de una limitación controlada. Está relacionado con la limitación controlada de StateTransition. Para obtener más información, consulteCuotas relacionadas con la limitación controlada de estadosen laAWS Step FunctionsGuía para desarrolladores.
ExecutionsAborted El número de ejecuciones canceladas o terminadas.
ExecutionsFailed El número de ejecuciones que han producido un error.
ExecutionsStarted El número de ejecuciones iniciadas.
ExecutionsSucceeded El número de ejecuciones realizadas correctamente.
ExecutionsTimedOut El número de ejecuciones cuyo tiempo de espera se agotó por algún motivo.

Métricas de ejecución Dimension for Step Functions

Dimensión Descripción
StateMachineArn

El nombre de recurso de Amazon (ARN) del equipo de estado de la ejecución en cuestión.

Métricas de actividad

LaAWS/StatesEl espacio de nombres incluye las siguientes métricas para las actividades de Step Functions.

Métrica Descripción
ActivityRunTime El intervalo, en milisegundos, entre el momento en que se inicia la actividad y el momento en que se cierra.
ActivityScheduleTime El intervalo, en milisegundos, en el que la actividad permanece en el estado de programación.
ActivityTime El intervalo, en milisegundos, entre el momento en que se programa la actividad y el momento en que se cierra.
ActivitiesFailed El número de actividades que han producido un error.
ActivitiesHeartbeatTimedOut El número de actividades cuyo tiempo de espera se agotó debido a que se agotó el tiempo de espera del latido.
ActivitiesScheduled El número de actividades programadas.
ActivitiesStarted El número de actividades iniciadas.
ActivitiesSucceeded El número de actividades realizadas correctamente.
ActivitiesTimedOut El número de actividades cuyo tiempo de espera se agotó durante el cierre.

Métricas de actividad Dimension for Step Functions

Dimensión Descripción

ActivityArn

El ARN de la actividad.

Métricas de funciones Lambda

LaAWS/StatesEl espacio de nombres incluye las siguientes métricas para las funciones Lambda de Step Functions.

Métrica Descripción
LambdaFunctionRunTime El intervalo, en milisegundos, entre el momento en que se inicia la función Lambda y el momento en que se cierra.
LambdaFunctionScheduleTime El intervalo, en milisegundos, en el que la función Lambda permanece en el estado de programación.
LambdaFunctionTime El intervalo, en milisegundos, entre el momento en que se programa la función Lambda y el momento en que se cierra.
LambdaFunctionsFailed El número de funciones Lambda que han producido un error.
LambdaFunctionsScheduled El número de funciones Lambda programadas.
LambdaFunctionsStarted El número de funciones Lambda iniciadas.
LambdaFunctionsSucceeded El número de funciones Lambda realizadas correctamente.
LambdaFunctionsTimedOut El número de funciones Lambda cuyo tiempo de espera se agotó durante el cierre.

Dimensión para Step Functions Métricas de funciones Lambda de

Dimensión Descripción

LambdaFunctionArn

El ARN de la función Lambda.

nota

Las métricas de funciones de Lambda se emiten para los estados de tarea que especifican el ARN de la función Lambda en el Resource. Estados de tareas que utilizan"Resource": "arn:aws:states:::lambda:invoke"En su lugar, emita métricas de integración de servicios. Para obtener más información, consulte Invocar Lambda con Step Functions.

Métricas de integración de servicios

LaAWS/StatesEl espacio de nombres incluye las siguientes métricas para las integraciones de servicios de Step Functions. Para obtener más información, consulte Utilización de AWS Step Functions con otros servicios.

Métrica Descripción
ServiceIntegrationRunTime El intervalo, en milisegundos, entre el momento en que se inicia la tarea de servicio y el momento en que se cierra.
ServiceIntegrationScheduleTime El intervalo, en milisegundos, en el que la tarea de servicio permanece en el estado de programación.
ServiceIntegrationTime El intervalo, en milisegundos, entre el momento en que se programa la tarea de servicio y el momento en que se cierra.
ServiceIntegrationsFailed El número de tareas de servicio que han producido un error.
ServiceIntegrationsScheduled El número de tareas de servicio programadas.
ServiceIntegrationsStarted El número de tareas de servicio iniciadas.
ServiceIntegrationsSucceeded El número de tareas de servicio realizadas correctamente.
ServiceIntegrationsTimedOut El número de tareas de servicio cuyo tiempo de espera se agotó durante el cierre.

Dimensión de Step Functions Service Integration Metrics de

Dimensión Descripción

ServiceIntegrationResourceArn

EL ARN de recurso del servicio integrado.

Métricas de servicios

LaAWS/StatesEl espacio de nombres incluye las siguientes métricas para el servicio Step Functions.

Métrica Descripción
ThrottledEvents

El número de solicitudes que han sido objeto de una limitación controlada.

ProvisionedBucketSize

El número de solicitudes disponibles por segundo.

ProvisionedRefillRate

El número de solicitudes por segundo que se permiten en el bucket.

ConsumedCapacity

El número de solicitudes por segundo.

Métricas de servicio Dimension for Step Functions

Dimensión Descripción

StateTransition

Filtra datos para mostrar las métricas de transiciones de estado.

Métricas de API

LaAWS/StatesEl espacio de nombres incluye las siguientes métricas para la API de Step Functions API de.

Métrica Descripción
ThrottledEvents

El número de solicitudes que han sido objeto de una limitación controlada.

ProvisionedBucketSize

El número de solicitudes disponibles por segundo.

ProvisionedRefillRate

El número de solicitudes por segundo que se permiten en el bucket.

ConsumedCapacity

El número de solicitudes por segundo.

Dimensiones de API de Dimensión de Step Functions

Dimensión Descripción

APIName

Filtra datos a una API con el nombre de API especificado.