Métricas de Amazon SWF para CloudWatch - Amazon Simple Workflow Service

Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.

Métricas de Amazon SWF para CloudWatch

Amazon SWF ahora proporciona métricas CloudWatch que puede utilizar para realizar un seguimiento de sus flujos de trabajo y actividades y configurar alarmas en los valores límite que elija. Puede ver las métricas mediante. AWS Management Console Para obtener más información, consulte Visualización de las métricas de Amazon SWF para CloudWatch mediante la AWS Management Console.

Unidades de informes para métricas de Amazon SWF

Métricas que registran un intervalo de tiempo

Algunas de las métricas de Amazon SWF CloudWatch son intervalos de tiempo, siempre medidos en milisegundos. La CloudWatch unidad se indica comoTime. Estas métricas, por lo general, corresponden a las fases de la ejecución del flujo de trabajo para los que se puede definir los tiempos de espera de flujo de trabajo y actividad y tienen nombres similares.

Por ejemplo, la métrica DecisionTaskStartToCloseTime mide el tiempo necesario para completar la tarea de decisión después de empezar a ejecutarse, que es el mismo periodo de tiempo para el que puede establecer un valor DecisionTaskStartToCloseTimeout.

Para ver un diagrama de cada una de estas fases del flujo de trabajo y saber cuándo se producen a lo largo de los ciclos de vida del flujo de trabajo y la actividad, consulte Tipos de tiempo de espera de Amazon SWF .

Métricas que registran un recuento

Algunas de las métricas de Amazon SWF para registrar los CloudWatch resultados como un recuento. Por ejemplo, WorkflowsCanceled, registra un resultado como uno o cero, indicando si el flujo de trabajo se ha cancelado o no. Un valor de cero no indica que la métrica no se ha registrado, solo que la condición descrita por la métrica no se produjo.

Algunas de las métricas de Amazon SWF para CloudWatch ese informe CloudWatch son un Count recuento por segundo. Por ejemploProvisionedRefillRate, si se indica como entrada Count CloudWatch, representa una tasa Count de solicitudes por segundo.

Para contar las métricas, el mínimo y máximo siempre serán cero o uno, pero el valor promedio será un valor de cero a uno.

Métricas de eventos de decisión y API

Puede monitorear los eventos de API y Decision CloudWatch para obtener información sobre su uso y capacidad. Consulte los decisores en la sección Cómo funciona Amazon SWF y el tema Decisión en la referencia de la API de Amazon Simple Workflow Service.

También se pueden monitorear estos límites para activar una alarma cuando el usuario se aproxime a sus límites de limitación controlada de Amazon SWF. Consulte Cuotas de limitación de Amazon SWF para obtener una descripción de estos límites y su configuración predeterminada. Estos límites se han diseñado para impedir que flujos de trabajo incorrectos consuman recursos excesivos del sistema. Para solicitar un aumento de sus límites, consulte: Solicitud de un aumento de cuota.

Como práctica recomendada, debes configurar CloudWatch las alarmas en torno al 60% de la capacidad de tu API o de los eventos de decisión. Esto le permitirá ajustar el flujo de trabajo o solicitar un aumento del límite del servicio antes de que se active la limitación controlada de Amazon SWF. Dependiendo de la explosividad de sus llamadas, puede configurar diversas alarmas para notificar cuando se aproxime a sus límites del servicio:

  • Si su tráfico tiene picos significativos, establezca una alarma en el 60 % de sus límites ProvisionedBucketSize.

  • Si sus llamadas tienen una tasa relativamente estable, establezca una alarma en el 60 % de su límite ProvisionedRefillRate para sus eventos de decisión y API relacionados.

Métricas de Amazon SWF

Las siguientes métricas están disponibles para Amazon SWF:

Métrica

Descripción

DecisionTaskScheduleToStartTime

El intervalo de tiempo, en milisegundos, entre el momento en que se programó la tarea de decisión y el momento en que la seleccionó un proceso de trabajo y la inició.

CloudWatch Unidades: Time

Dimensiones: Domain, WorkflowTypeName, WorkflowTypeVersion

Estadísticas válidas: Average, Minimum, Maximum

DecisionTaskStartToCloseTime

El intervalo de tiempo, en milisegundos, entre el momento en que se inició la decisión y el momento en que se cerró.

CloudWatch Unidades: Time

Dimensiones: Domain, WorkflowTypeName, WorkflowTypeVersion

Estadísticas válidas: Average, Minimum, Maximum

DecisionTasksCompleted

El número de tareas de decisión que se han completado.

CloudWatch Unidades: Count

Dimensiones: Domain, WorkflowTypeName, WorkflowTypeVersion

Estadísticas válidas: Sum

PendingTasks

Número de tareas pendientes en un intervalo de 1 minuto para una lista de tareas específica.

CloudWatch Unidades: Count

Dimensiones: Domain, TaskListName

Estadísticas válidas: Sum

StartedDecisionTasksTimedOutOnClose

El número de tareas de decisión que se iniciaron pero cuyo tiempo de espera se agotó durante el cierre.

CloudWatch Unidades: Count

Dimensiones: Domain, WorkflowTypeName, WorkflowTypeVersion

Estadísticas válidas: Sum

WorkflowStartToCloseTime

El tiempo, en milisegundos, entre el momento en que se inició el flujo de trabajo y el momento en que se cerró.

CloudWatch Unidades: Time

Dimensiones: Domain, WorkflowTypeName, WorkflowTypeVersion

Estadísticas válidas: Average, Minimum, Maximum

WorkflowsCanceled

El número de flujos de trabajo que se cancelaron.

CloudWatch Unidades: Count

Dimensiones: Domain, WorkflowTypeName, WorkflowTypeVersion

Estadísticas válidas: Sum

WorkflowsCompleted

El número de flujos de trabajo que se completaron.

CloudWatch Unidades: Count

Dimensiones: Domain, WorkflowTypeName, WorkflowTypeVersion

Estadísticas válidas: Sum

WorkflowsContinuedAsNew

El número de flujos de trabajo que continuaron como nuevos.

CloudWatch Unidades: Count

Dimensiones: Domain, WorkflowTypeName, WorkflowTypeVersion

Estadísticas válidas: Sum

WorkflowsFailed

El número de flujos de trabajo que produjeron un error.

CloudWatch Unidades: Count

Dimensiones: Domain, WorkflowTypeName, WorkflowTypeVersion

Estadísticas válidas: Sum

WorkflowsTerminated

El número de flujos de trabajo que se terminaron.

CloudWatch Unidades: Count

Dimensiones: Cause, Domain, WorkflowTypeName, WorkflowTypeVersion

Estadísticas válidas: Sum

WorkflowsTimedOut

El número de flujos de trabajo para los que se agotó el tiempo de espera, por cualquier motivo.

CloudWatch Unidades: Count

Dimensiones: Domain, WorkflowTypeName, WorkflowTypeVersion

Estadísticas válidas: Sum

ActivityTaskScheduleToCloseTime

El intervalo de tiempo, en milisegundos, entre el momento en que se programó la actividad y el momento en que se cerró.

CloudWatch Unidades: Time

Dimensiones: Domain, ActivityTypeName, ActivityTypeVersion

Estadísticas válidas: Average, Minimum, Maximum

ActivityTaskScheduleToStartTime

El intervalo de tiempo, en milisegundos, entre el momento en que se programó la tarea de actividad y el momento en que se inició.

CloudWatch Unidades: Time

Dimensiones: Domain, ActivityTypeName, ActivityTypeVersion

Estadísticas válidas: Average, Minimum, Maximum

ActivityTaskStartToCloseTime

El intervalo de tiempo, en milisegundos, entre el momento en que se inició la tarea de actividad y el momento en que se cerró.

CloudWatch Unidades: Time

Dimensiones: Domain, ActivityTypeName, ActivityTypeVersion

Estadísticas válidas: Average, Minimum, Maximum

ActivityTasksCanceled

El número de tareas de actividad que se cancelaron.

CloudWatch Unidades: Count

Dimensiones: Domain, ActivityTypeName, ActivityTypeVersion

Estadísticas válidas: Sum

ActivityTasksCompleted

El número de tareas de actividad que se completaron.

CloudWatch Unidades: Count

Dimensiones: Domain, ActivityTypeName, ActivityTypeVersion

Estadísticas válidas: Sum

ActivityTasksFailed

El número de tareas de actividad que produjeron un error.

CloudWatch Unidades: Count

Dimensiones: Domain, ActivityTypeName, ActivityTypeVersion

Estadísticas válidas: Sum

ScheduledActivityTasksTimedOutOnClose

El número de tareas de actividad que se programaron pero cuyo tiempo de espera se agotó durante el cierre.

CloudWatch Unidades: Count

Dimensiones: Domain, ActivityTypeName, ActivityTypeVersion

Estadísticas válidas: Sum

ScheduledActivityTasksTimedOutOnStart

El número de tareas de actividad que se programaron pero cuyo tiempo de espera se agotó durante el inicio.

CloudWatch Unidades: Count

Dimensiones: Domain, ActivityTypeName, ActivityTypeVersion

Estadísticas válidas: Sum

StartedActivityTasksTimedOutOnClose

El número de tareas de actividad que se iniciaron pero cuyo tiempo de espera se agotó durante el cierre.

CloudWatch Unidades: Count

Dimensiones: Domain, ActivityTypeName, ActivityTypeVersion

Estadísticas válidas: Sum

StartedActivityTasksTimedOutOnHeartbeat

El número de tareas de actividad que se iniciaron pero cuyo tiempo de espera se agotó debido a que se agotó el tiempo de espera del latido.

CloudWatch Unidades: Count

Dimensiones: Domain, ActivityTypeName, ActivityTypeVersion

Estadísticas válidas: Sum

ThrottledEvents

El número de solicitudes que han sido objeto de una limitación controlada.

CloudWatch Unidades: Count

Dimensiones: APIName, DecisionName, ThrottlingScope

Estadísticas válidas: Sum

ProvisionedBucketSize

El número de solicitudes disponibles por segundo.

Dimensiones: APIName, DecisionName

Estadísticas válidas: Minimum

ConsumedCapacity

El número de solicitudes por segundo.

CloudWatch Unidades: Count

Dimensiones: APIName, DecisionName

Estadísticas válidas: Sum

ConsumedLimit

La cantidad del límite general que se ha consumido.

Dimensiones: GeneralLimitType

ProvisionedRefillRate

El número de solicitudes por segundo que se permiten en el bucket.

Dimensiones: APIName, DecisionName

Estadísticas válidas: Minimum

ProvisionedLimit

La cantidad del límite general que se aprovisiona a la cuenta.

Dimensiones: GeneralLimitType

Dimensión

Descripción

Domain

Filtra datos al dominio de Amazon SWF en el que se ejecuta el flujo de trabajo o la actividad.

ActivityTypeName

Filtra datos al nombre del tipo de actividad.

ActivityTypeVersion

Filtra datos a la versión del tipo de actividad.

WorkflowTypeName

Filtra datos al nombre del tipo de flujo de trabajo para esta ejecución de flujo de trabajo.

WorkflowTypeVersion

Filtra datos a la versión del tipo de flujo de trabajo para esta ejecución de flujo de trabajo.

APIName

Filtra datos a una API con el nombre de API especificado.

DecisionName

Filtra datos al nombre de decisión especificado.

TaskListName

Filtra datos al nombre de Lista de tareas especificado.

TaskListClassification

Filtra datos a la clasificación de la lista de tareas. El valor es “D” para las listas de tareas de decisión y “A” para las listas de tareas de actividad.

ThrottlingScope

Filtra los datos según el alcance de regulación especificado. El valor es «Cuenta» cuando se supera la cuota a nivel de cuenta, o «Flujo de trabajo» cuando se supera la cuota a nivel de flujo de trabajo.

Nombres y dimensiones de recursos de Amazon SWF que no son ASCII CloudWatch

Amazon SWF permite caracteres no ASCII en nombres de recursos como y. TaskList DomainName Sin embargo, los valores de dimensión de CloudWatch las métricas solo pueden contener caracteres ASCII imprimibles. Para garantizar que Amazon SWF utiliza valores de dimensión compatibles con los CloudWatch requisitos, los nombres de los recursos de Amazon SWF que no cumplen estos requisitos se convierten y se les añade una suma de control de la siguiente manera:

  • Cualquier carácter que no sea ASCII se sustituye por ?.

  • La cadena de entrada o la cadena convertida se truncará, si es necesario. Esto garantiza que, cuando se añada la suma de comprobación, la nueva longitud de la cadena no supere el máximo. CloudWatch

  • Como todos los caracteres que no son ASCII se convierten en caracteres?, algunos valores de dimensiones CloudWatch métricas que eran diferentes antes de la conversión pueden parecer los mismos después de la conversión. Para ayudar a diferenciar dichos valores, se añade al nombre del recurso un guion bajo (_) seguido de los 16 primeros caracteres de la suma de comprobación SHA256 del nombre del recurso original.

Ejemplos de conversión:

  • test àpple se convertiría en test ?pple_82cc5b8e3a771d12.

  • àòà se convertiría en ???_2fec5edbb2c05c22.

  • Los TaskList nombres àpplé y ambos se âpplè convertirían en idénticos ?ppl? y serían idénticos. Al agregar la suma de comprobación, se obtienen valores distintos: ?ppl?_f39a36df9d85a69d y ?ppl?_da3efb4f11dd0f7f.

sugerencia

Puede generar su propia suma de comprobación SHA256. Por ejemplo, para utilizar la herramienta de línea de comandos shasum:

echo -n "<the original resource name>" | shasum -a 256 | cut -c1-16