Métricas recomendadas - Amazon CloudWatch

Métricas recomendadas

En la siguiente tabla se indican las métricas recomendadas para cada tipo de componente.

Tipo de componente Tipo de carga de trabajo Métrica que se sugiere

Instancia EC2 (servidores Windows)

Valor predeterminado/Personalizado

CPUUtilization

StatusCheckFailed

Porcentaje de tiempo de procesador del procesador

Porcentaje de bytes confirmados en uso en memoria

Porcentaje de espacio libre en disco lógico

Mbytes disponibles de memoria

Active Directory

CPUUtilization

StatusCheckFailed

Porcentaje de tiempo de procesador del procesador

Porcentaje de bytes confirmados en uso en memoria

Mbytes disponibles de memoria

Base de datos ==> Porcentaje de aciertos de la caché de la base de datos de instancias

Operaciones de replicación pendientes de DRA de DirectoryServices

Sincronizaciones de replicación pendientes de DRA de DirectoryServices

Error de consulta recursiva de DNS por segundo

Promedio LogicalDisk Longitud de la cola de disco

Aplicación Java

CPUUtilization

StatusCheckFailed

Porcentaje de tiempo de procesador del procesador

Porcentaje de bytes confirmados en uso en memoria

Mbytes disponibles de memoria

java_lang_threading_threadcount

java_lang_classloading_loadedclasscount

java_lang_memory_heapmemoryusage_used

java_lang_memory_heapmemoryusage_committed

java_lang_operatingsystem_freephysicalmemorysize

java_lang_operatingsystem_freeswapspacesize

Servidor front-end web de Microsoft IIS/.NET

CPUUtilization

StatusCheckFailed

Porcentaje de tiempo de procesador del procesador

Porcentaje de bytes confirmados en uso en memoria

Mbytes disponibles de memoria

.NET CLR Exceptions: n.º de excepciones generadas/segundo

.NET CLR Memory: n.º de bytes confirmados totales

Tiempo de % de memoria de CLR de .NET en GC

Solicitudes de aplicaciones ASP.NET en la cola de aplicaciones

Solicitudes ASP.NET en cola

Reinicios de aplicaciones ASP.NET

Capa de base de datos de Microsoft SQL Server

CPUUtilization

StatusCheckFailed

Porcentaje de tiempo de procesador del procesador

Porcentaje de bytes confirmados en uso en memoria

Mbytes disponibles de memoria

Porcentaje de uso de archivo de paginación

Longitud de cola del procesador del sistema

Total de bytes de interfaz de red/segundo

Porcentaje de tiempo de disco en disco físico

SQLServer: administrador del búfer: porcentaje de aciertos de caché del búfer

SQLServer: administrador del búfer: duración prevista de página

SQLServer: estadísticas generales: procesos bloqueados

SQLServer: estadísticas generales: conexiones de usuario

SQLServer: bloqueos: número de interbloqueos/segundo

SQLServer: estadísticas de SQL: solicitudes por lotes/segundo

MySQL

CPUUtilization

StatusCheckFailed

Porcentaje de tiempo de procesador del procesador

Porcentaje de bytes confirmados en uso en memoria

Porcentaje de espacio libre en disco lógico

Mbytes disponibles de memoria

.NET workerpool/capa intermedia

CPUUtilization

StatusCheckFailed

Porcentaje de tiempo de procesador del procesador

Porcentaje de bytes confirmados en uso en memoria

Mbytes disponibles de memoria

.NET CLR Exceptions: n.º de excepciones generadas/segundo

.NET CLR Memory: n.º de bytes confirmados totales

Tiempo de % de memoria de CLR de .NET en GC

Capa básica de .NET

CPUUtilization

StatusCheckFailed

Porcentaje de tiempo de procesador del procesador

Porcentaje de bytes confirmados en uso en memoria

Mbytes disponibles de memoria

Oracle

CPUUtilization

StatusCheckFailed

Porcentaje de tiempo de procesador del procesador

Porcentaje de bytes confirmados en uso en memoria

Porcentaje de espacio libre en disco lógico

Mbytes disponibles de memoria

Postgres

CPUUtilization

StatusCheckFailed

Porcentaje de tiempo de procesador del procesador

Porcentaje de bytes confirmados en uso en memoria

Porcentaje de espacio libre en disco lógico

Mbytes disponibles de memoria

SharePoint

CPUUtilization

StatusCheckFailed

Porcentaje de tiempo de procesador del procesador

Porcentaje de bytes confirmados en uso en memoria

Mbytes disponibles de memoria

Trims de API de la caché de aplicaciones ASP.NET

Solicitudes ASP.NET rechazadas

Reinicios del proceso de trabajo ASP.NET

Páginas de memoria/segundo

Vaciados de caché de publicación de la caché de publicación de SharePoint por segundo

Solicitud de página/tiempo de ejecución de SharePoint Foundation

Número total de compactaciones de la caché basada en disco de SharePoint

Relación de aciertos de caché de blob de la caché basada en disco de SharePoint

Relación de llenado de caché de blob de la caché basada en disco de SharePoint

Vaciados de caché de blob de la caché basada en disco de SharePoint por segundo

Solicitudes ASP.NET en cola

Solicitudes de aplicaciones ASP.NET en la cola de aplicaciones

Reinicios de aplicaciones ASP.NET

Promedio LogicalDisk Escritura en disco/segundo

Promedio LogicalDisk Lectura de disco/segundo

Porcentaje de horas de interrupción del procesador

Instancia EC2 (servidores Linux)

Valor predeterminado/Personalizado

CPUUtilization

StatusCheckFailed

disk_used_percent

mem_used_percent

Aplicación Java

CPUUtilization

StatusCheckFailed

disk_used_percent

mem_used_percent

java_lang_threading_threadcount

java_lang_classloading_loadedclasscount

java_lang_memory_heapmemoryusage_used

java_lang_memory_heapmemoryusage_committed

java_lang_operatingsystem_freephysicalmemorysize

java_lang_operatingsystem_freeswapspacesize

Capa básica de.NET o capa de base de datos SQL Server

CPUUtilization

StatusCheckFailed

disk_used_percent

mem_used_percent

Oracle

CPUUtilization

StatusCheckFailed

disk_used_percent

mem_used_percent

Postgres

CPUUtilization

StatusCheckFailed

disk_used_percent

mem_used_percent

Grupo de instancias EC2

SAP HANA de varios nodos o de un solo nodo
  • hanadb_server_startup_time_variations_seconds

  • hanadb_level_5_alerts_count

  • hanadb_level_4_alerts_count

  • hanadb_out_of_memory_events_count

  • hanadb_max_trigger_read_ratio_percent

  • hanadb_max_trigger_write_ratio_percent

  • hanadb_log_switch_race_ratio_percent

  • hanadb_time_since_last_savepoint_seconds

  • hanadb_disk_usage_highlevel_percent

  • hanadb_current_allocation_limit_used_percent

  • hanadb_table_allocation_limit_used_percent

  • hanadb_cpu_usage_percent

  • hanadb_plan_cache_hit_ratio_percent

  • hanadb_last_data_backup_age_days

Volumen de EBS Cualquiera

VolumeReadBytes

VolumeWriteBytes

VolumeReadOps

VolumeWriteOps

VolumeQueueLength

VolumeThroughputPercentage

VolumenConsumedReadWriteOps

BurstBalance

Classic ELB

Cualquiera

HTTPCode_Backend_4XX

HTTPCode_Backend_5XX

Latencia

SurgeQueueLength

UnHealthyHostCount

Application ELB

Cualquiera

HTTPCode_Target_4XX_Count

HTTPCode_Target_5XX_Count

TargetResponseTime

UnHealthyHostCount

Instancia de base de datos de RDS

Cualquiera

CPUUtilization

ReadLatency

WriteLatency

BurstBalance

FailedSQLServerAgentJobsCount

Clúster de base de datos de RDS Cualquiera

CPUUtilization

CommitLatency

DatabaseConnections

Interbloqueos

FreeableMemory

NetworkThroughput

VolumeBytesUsed

Función Lambda

Cualquiera

Duración

Errores

IteratorAge

ProvisionedConcurrencySpilloverInvocations

Limitaciones

Cola de SQS

Cualquiera

ApproximateAgeOfOldestMessage

ApproximateNumberOfMessagesVisible

NumberOfMessagesSent

Tabla de Amazon DynamoDB. Cualquiera

SystemErrors

UserErrors

ConsumedReadCapacityUnits

ConsumedWriteCapacityUnits

ReadThrottleEvents

WriteThrottleEvents

CondicionalCheckFailedRequests

TransactionConflict

Bucket de Amazon S3

Cualquiera

Si la configuración de replicación con Control del Tiempo de Replicación (RTC) está habilitada:

ReplicationLatency

BytesPendingReplication

OperationsPendingReplication

Si las métricas de solicitud están activadas:

5xxErrors

4xxErrors

BytesDownloaded

BytesUploaded

AWS Step Functions

Cualquiera
General
  • ExecutionThrottled

  • ExecutionsAborted

  • ProvisionedBucketSize

  • ProvisionedRefillRate

  • ConsumedCapacity

Si el tipo de máquina de estado es EXPRESS o el nivel de grupo de registro es OFF
  • ExecutionsFailed

  • ExecutionsTimedOut

Si la máquina de estado tiene funciones de Lambda
  • LambdaFunctionsFailed

  • LambdaFunctionsTimedOut

Si la máquina de estado tiene actividades
  • ActivitiesFailed

  • ActivitiesTimedOut

  • ActivitiesHeartbeatTimedOut

Si la máquina de estado tiene integraciones de servicio
  • ServiceIntegrationsFailed

  • ServiceIntegrationsTimedOut

Estado de la API REST de API Gateway

Cualquiera
  • 4XXErrors

  • 5XXErrors

  • Latencia

Clúster de ECS

Cualquiera

CpuUtilized

MemoryUtilized

NetworkRxBytes

NetworkTxBytes

RunningTaskCount

PendingTaskCount

StorageReadBytes

StorageWriteBytes

CPUReservation (solo tipo de lanzamiento de EC2)

CPUUtilization (solo tipo de lanzamiento de EC2)

MemoryReservation (solo tipo de lanzamiento de EC2)

MemoryUtilization (solo tipo de lanzamiento de EC2)

GPUReservation (solo tipo de lanzamiento de EC2)

instance_cpu_utilization (sólo tipo de lanzamiento de EC2)

instance_filesystem_utilization (sólo tipo de lanzamiento de EC2)

instance_memory_utilization (sólo tipo de lanzamiento de EC2)

instance_network_total_bytes (sólo tipo de lanzamiento de EC2)

Aplicación de Java

CpuUtilized

MemoryUtilized

NetworkRxBytes

NetworkTxBytes

RunningTaskCount

PendingTaskCount

StorageReadBytes

StorageWriteBytes

CPUReservation (solo tipo de lanzamiento de EC2)

CPUUtilization (solo tipo de lanzamiento de EC2)

MemoryReservation (solo tipo de lanzamiento de EC2)

MemoryUtilization (solo tipo de lanzamiento de EC2)

GPUReservation (solo tipo de lanzamiento de EC2)

instance_cpu_utilization (sólo tipo de lanzamiento de EC2)

instance_filesystem_utilization (sólo tipo de lanzamiento de EC2)

instance_memory_utilization (sólo tipo de lanzamiento de EC2)

instance_network_total_bytes (sólo tipo de lanzamiento de EC2)

java_lang_threading_threadcount

java_lang_classloading_loadedclasscount

java_lang_memory_heapmemoryusage_used

java_lang_memory_heapmemoryusage_committed

java_lang_operatingsystem_freephysicalmemorysize

java_lang_operatingsystem_freeswapspacesize

servicio de ECS

Cualquiera

CPUUtilization

MemoryUtilization

CpuUtilized

MemoryUtilized

NetworkRxBytes

NetworkTxBytes

RunningTaskCount

PendingTaskCount

StorageReadBytes

StorageWriteBytes

Aplicación de Java

CPUUtilization

MemoryUtilization

CpuUtilized

MemoryUtilized

NetworkRxBytes

NetworkTxBytes

RunningTaskCount

PendingTaskCount

StorageReadBytes

StorageWriteBytes

java_lang_threading_threadcount

java_lang_classloading_loadedclasscount

java_lang_memory_heapmemoryusage_used

java_lang_memory_heapmemoryusage_committed

java_lang_operatingsystem_freephysicalmemorysize

java_lang_operatingsystem_freeswapspacesize

Clúster de EKS

Cualquiera

cluster_failed_node_count

node_cpu_reserved_capacity

node_cpu_utilization

node_filesystem_utilization

node_memory_reserved_capacity

node_memory_utilization

node_network_total_bytes

pod_cpu_reserved_capacity

pod_cpu_utilization

pod_cpu_utilization_over_pod_limit

pod_memory_reserved_capacity

pod_memory_utilization

pod_memory_utilization_over_pod_limit

pod_network_rx_bytes

pod_network_tx_bytes

Aplicación Java

cluster_failed_node_count

node_cpu_reserved_capacity

node_cpu_utilization

node_filesystem_utilization

node_memory_reserved_capacity

node_memory_utilization

node_network_total_bytes

pod_cpu_reserved_capacity

pod_cpu_utilization

pod_cpu_utilization_over_pod_limit

pod_memory_reserved_capacity

pod_memory_utilization

pod_memory_utilization_over_pod_limit

pod_network_rx_bytes

pod_network_tx_bytes

java_lang_threading_threadcount

java_lang_classloading_loadedclasscount

java_lang_memory_heapmemoryusage_used

java_lang_memory_heapmemoryusage_committed

java_lang_operatingsystem_freephysicalmemorysize

java_lang_operatingsystem_freeswapspacesize

Clúster de Kubernetes en EC2

Cualquiera

cluster_failed_node_count

node_cpu_reserved_capacity

node_cpu_utilization

node_filesystem_utilization

node_memory_reserved_capacity

node_memory_utilization

node_network_total_bytes

pod_cpu_reserved_capacity

pod_cpu_utilization

pod_cpu_utilization_over_pod_limit

pod_memory_reserved_capacity

pod_memory_utilization

pod_memory_utilization_over_pod_limit

pod_network_rx_bytes

pod_network_tx_bytes

Aplicación Java

cluster_failed_node_count

node_cpu_reserved_capacity

node_cpu_utilization

node_filesystem_utilization

node_memory_reserved_capacity

node_memory_utilization

node_network_total_bytes

pod_cpu_reserved_capacity

pod_cpu_utilization

pod_cpu_utilization_over_pod_limit

pod_memory_reserved_capacity

pod_memory_utilization

pod_memory_utilization_over_pod_limit

pod_network_rx_bytes

pod_network_tx_bytes

java_lang_threading_threadcount

java_lang_classloading_loadedclasscount

java_lang_memory_heapmemoryusage_used

java_lang_memory_heapmemoryusage_committed

java_lang_operatingsystem_freephysicalmemorysize

java_lang_operatingsystem_freeswapspacesize

En la siguiente tabla se enumeran los procesos recomendados y las métricas del proceso para cada tipo de componente. Información de aplicaciones de CloudWatch no recomienda la monitorización de procesos para aquellos que no se ejecutan en una instancia.

Tipo de componente Tipo de carga de trabajo Proceso recomendado Métrica que se sugiere

Instancia EC2 (servidores Windows)

Servidor front-end web de Microsoft IIS/.NET

w3wp

procstat cpu_usage,

procstat memory_rss,

procstat memory_vms,

procstat read_bytes,

procstat write_bytes

Capa de base de datos de Microsoft SQL Server

SQLAgent

procstat cpu_usage,

procstat memory_rss,

procstat memory_vms,

procstat read_bytes,

procstat write_bytes

sqlservr

procstat cpu_usage,

procstat memory_rss,

procstat memory_vms,

procstat read_bytes,

procstat write_bytes

sqlwriter

procstat cpu_usage,

procstat memory_rss

ReportingServicesService

procstat cpu_usage,

procstat memory_rss

MsDtsServr

procstat cpu_usage,

procstat memory_rss,

procstat memory_vms,

procstat read_bytes,

procstat write_bytes

Msmdsrv

procstat cpu_usage,

procstat memory_rss,

procstat memory_vms,

procstat read_bytes,

procstat write_bytes

.NET workerpool/capa intermedia

w3wp

procstat cpu_usage,

procstat memory_rss,

procstat memory_vms,

procstat read_bytes,

procstat write_bytes

Capa básica de .NET

w3wp

procstat cpu_usage,

procstat memory_rss,

procstat memory_vms,

procstat read_bytes,

procstat write_bytes