Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.
Monitoreo de Step Functions con CloudWatch
La monitorización es una parte importante del mantenimiento de la fiabilidad, la disponibilidad y el rendimiento de AWS Step Functions y sus soluciones de AWS. Para que le resulte más sencillo depurar los errores que se producen en distintas partes del código, debe recopilar la mayor cantidad posible de datos de monitorización de los servicios de AWS que utilice. Antes de empezar la monitorización de Step Functions, debe crear un plan de monitorización que responda a las siguientes preguntas:
-
¿Cuáles son los objetivos de la monitorización?
-
¿Qué recursos va a monitorizar?
-
¿Con qué frecuencia va a monitorizar estos recursos?
-
¿Qué herramientas de monitoreo va a utilizar?
-
¿Quién se encargará de realizar las tareas de monitoreo?
-
¿Quién debería recibir una notificación cuando surjan problemas?
El siguiente paso consiste en establecer una línea de referencia para el rendimiento normal de Step Functions en su entorno. Para ello, mida el rendimiento en diversas ocasiones y con diferentes condiciones de carga. Cuando monitorice Step Functions, guarde los datos históricos de monitorización. Estos datos pueden servirle como referencia para compararlos con los datos de rendimiento actuales, para identificar los patrones de rendimiento normales y las anomalías del rendimiento, y para idear métodos de solución de problemas.
Por ejemplo, con Step Functions, puede supervisar cuántas actividades oAWS LambdaLas tareas de errores porque se ha agotado el tiempo de espera del latido. Si el rendimiento se sale de la referencia establecida, es posible que tenga que cambiar el intervalo de latidos.
Para establecer un punto de referencia debe, como mínimo, monitorizar las siguientes métricas:
-
ActivitiesStarted
-
ActivitiesTimedOut
-
ExecutionsStarted
-
ExecutionsTimedOut
-
LambdaFunctionsStarted
-
LambdaFunctionsTimedOut
En las secciones siguientes, se describen las métricas que Step Functions proporciona a Amazon CloudWatch. Puede utilizarlas para supervisar las máquinas de estado y las actividades, así como para establecer alarmas en los valores que actúan como umbral. Puede consultar las métricas utilizando la AWS Management Console.
Temas
- Métricas que registran un intervalo de tiempo
- Métricas que registran un recuento
- Métricas de ejecución
- Métricas de actividad
- Métricas de funciones Lambda
- Métricas de integración de servicios
- Métricas de servicios
- Métricas de API
- Visualización de métricas de Step Functions
- Establecimiento de alarmas de para Step Functions
Métricas que registran un intervalo de tiempo
Algunas de las métricas de Step Functions CloudWatch son:intervalos de tiempo, que siempre se mide en milisegundos. Estas métricas, por lo general, se corresponden con fases de ejecución en las que puede definir tiempos de espera para las máquinas de estado, las actividades y las funciones Lambda, utilizando nombres descriptivos.
Por ejemplo, la métrica ActivityRunTime
mide el tiempo que tarda una actividad en completarse una vez que comienza su ejecución Puede establecer un tiempo de espera con este mismo período de tiempo.
En la consola de CloudWatch, obtendrá mejores resultados si selecciona average como la estadística que debe aparecer con las métricas de intervalo de tiempo.
Métricas que registran un recuento
Algunas de las métricas de CloudWatch para Step Functions registran los resultados enconteo. Por ejemplo, ExecutionsFailed
registra el número o recuento de ejecuciones con errores de la máquina de estado.
En la consola de CloudWatch, obtendrá mejores resultados si selecciona sum como la estadística que debe aparecer con las métricas de recuento.
Métricas de ejecución
LaAWS/States
El espacio de nombres incluye las siguientes métricas para las ejecuciones de Step Functions.
Métrica | Descripción |
---|---|
ExecutionTime |
El intervalo, en milisegundos, entre el momento en que se inicia la ejecución y el momento en que se cierra. |
ExecutionThrottled |
El número de eventos StateEntered y de reintentos que han sido objeto de una limitación controlada. Está relacionado con la limitación controlada de StateTransition . Para obtener más información, consulteCuotas relacionadas con la limitación controlada de estadosen laAWS Step FunctionsGuía para desarrolladores. |
ExecutionsAborted |
El número de ejecuciones canceladas o terminadas. |
ExecutionsFailed |
El número de ejecuciones que han producido un error. |
ExecutionsStarted |
El número de ejecuciones iniciadas. |
ExecutionsSucceeded |
El número de ejecuciones realizadas correctamente. |
ExecutionsTimedOut |
El número de ejecuciones cuyo tiempo de espera se agotó por algún motivo. |
Métricas de ejecución Dimension for Step Functions
Dimensión | Descripción |
---|---|
StateMachineArn
|
El nombre de recurso de Amazon (ARN) del equipo de estado de la ejecución en cuestión. |
Métricas de actividad
LaAWS/States
El espacio de nombres incluye las siguientes métricas para las actividades de Step Functions.
Métrica | Descripción |
---|---|
ActivityRunTime
|
El intervalo, en milisegundos, entre el momento en que se inicia la actividad y el momento en que se cierra. |
ActivityScheduleTime |
El intervalo, en milisegundos, en el que la actividad permanece en el estado de programación. |
ActivityTime |
El intervalo, en milisegundos, entre el momento en que se programa la actividad y el momento en que se cierra. |
ActivitiesFailed |
El número de actividades que han producido un error. |
ActivitiesHeartbeatTimedOut |
El número de actividades cuyo tiempo de espera se agotó debido a que se agotó el tiempo de espera del latido. |
ActivitiesScheduled |
El número de actividades programadas. |
ActivitiesStarted |
El número de actividades iniciadas. |
ActivitiesSucceeded |
El número de actividades realizadas correctamente. |
ActivitiesTimedOut |
El número de actividades cuyo tiempo de espera se agotó durante el cierre. |
Métricas de actividad Dimension for Step Functions
Dimensión | Descripción |
---|---|
|
El ARN de la actividad. |
Métricas de funciones Lambda
LaAWS/States
El espacio de nombres incluye las siguientes métricas para las funciones Lambda de Step Functions.
Métrica | Descripción |
---|---|
LambdaFunctionRunTime |
El intervalo, en milisegundos, entre el momento en que se inicia la función Lambda y el momento en que se cierra. |
LambdaFunctionScheduleTime |
El intervalo, en milisegundos, en el que la función Lambda permanece en el estado de programación. |
LambdaFunctionTime |
El intervalo, en milisegundos, entre el momento en que se programa la función Lambda y el momento en que se cierra. |
LambdaFunctionsFailed |
El número de funciones Lambda que han producido un error. |
LambdaFunctionsScheduled |
El número de funciones Lambda programadas. |
LambdaFunctionsStarted |
El número de funciones Lambda iniciadas. |
LambdaFunctionsSucceeded |
El número de funciones Lambda realizadas correctamente. |
LambdaFunctionsTimedOut |
El número de funciones Lambda cuyo tiempo de espera se agotó durante el cierre. |
Dimensión para Step Functions Métricas de funciones Lambda de
Dimensión | Descripción |
---|---|
|
El ARN de la función Lambda. |
Las métricas de funciones de Lambda se emiten para los estados de tarea que especifican el ARN de la función Lambda en el
Resource
. Estados de tareas que utilizan"Resource": "arn:aws:states:::lambda:invoke"
En su lugar, emita métricas de integración de servicios. Para obtener más información, consulte Invocar Lambda con Step Functions.
Métricas de integración de servicios
LaAWS/States
El espacio de nombres incluye las siguientes métricas para las integraciones de servicios de Step Functions. Para obtener más información, consulte Utilización de AWS Step Functions con otros servicios.
Métrica | Descripción |
---|---|
ServiceIntegrationRunTime |
El intervalo, en milisegundos, entre el momento en que se inicia la tarea de servicio y el momento en que se cierra. |
ServiceIntegrationScheduleTime |
El intervalo, en milisegundos, en el que la tarea de servicio permanece en el estado de programación. |
ServiceIntegrationTime |
El intervalo, en milisegundos, entre el momento en que se programa la tarea de servicio y el momento en que se cierra. |
ServiceIntegrationsFailed |
El número de tareas de servicio que han producido un error. |
ServiceIntegrationsScheduled |
El número de tareas de servicio programadas. |
ServiceIntegrationsStarted |
El número de tareas de servicio iniciadas. |
ServiceIntegrationsSucceeded |
El número de tareas de servicio realizadas correctamente. |
ServiceIntegrationsTimedOut |
El número de tareas de servicio cuyo tiempo de espera se agotó durante el cierre. |
Dimensión de Step Functions Service Integration Metrics de
Dimensión | Descripción |
---|---|
|
EL ARN de recurso del servicio integrado. |
Métricas de servicios
LaAWS/States
El espacio de nombres incluye las siguientes métricas para el servicio Step Functions.
Métrica | Descripción |
---|---|
ThrottledEvents
|
El número de solicitudes que han sido objeto de una limitación controlada. |
ProvisionedBucketSize |
El número de solicitudes disponibles por segundo. |
ProvisionedRefillRate |
El número de solicitudes por segundo que se permiten en el bucket. |
ConsumedCapacity |
El número de solicitudes por segundo. |
Métricas de servicio Dimension for Step Functions
Dimensión | Descripción |
---|---|
|
Filtra datos para mostrar las métricas de transiciones de estado. |
Métricas de API
LaAWS/States
El espacio de nombres incluye las siguientes métricas para la API de Step Functions API de.
Métrica | Descripción |
---|---|
ThrottledEvents
|
El número de solicitudes que han sido objeto de una limitación controlada. |
ProvisionedBucketSize |
El número de solicitudes disponibles por segundo. |
ProvisionedRefillRate |
El número de solicitudes por segundo que se permiten en el bucket. |
ConsumedCapacity |
El número de solicitudes por segundo. |
Dimensiones de API de Dimensión de Step Functions
Dimensión | Descripción |
---|---|
|
Filtra datos a una API con el nombre de API especificado. |