Supervise las métricas de sus recursos de Lightsail - Amazon Lightsail

Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.

Supervise las métricas de sus recursos de Lightsail

Supervise el rendimiento de sus instancias, bases de datos, distribuciones, balanceadores de carga, servicios de contenedores y depósitos en Amazon Lightsail comprobando y recopilando sus datos de métricas. Establezca una línea de base a lo largo del tiempo, de modo que pueda configurar alarmas para detectar con mayor facilidad anomalías y problemas con el rendimiento de sus recursos.

Amazon Lightsail informa de los datos métricos de las instancias, las bases de datos, las distribuciones de redes de entrega de contenido (CDN), los balanceadores de carga, los servicios de contenedores y los buckets. Puede ver y supervisar estos datos en la consola Lightsail. La monitorización es una parte importante del mantenimiento de la fiabilidad, la disponibilidad y el desempeño de sus recursos. Supervise y recopile datos de métricas de sus recursos con regularidad para que pueda depurar con mayor facilidad un error de múltiples puntos, si ocurre alguno.

Contenido

Monitoreo eficaz de sus recursos

Debe establecer una línea de base para el rendimiento normal de los recursos en su entorno. Mida el rendimiento en varias ocasiones y con diferentes condiciones de carga. A medida que supervisa los recursos, debe anotar y registrar un historial del rendimiento del recurso a lo largo del tiempo. Compare el rendimiento actual de sus recursos con los datos históricos recopilados. Esto le ayuda a identificar patrones de rendimiento normales y anomalías de rendimiento, y a idear métodos para abordarlos.

Por ejemplo, puede supervisar la utilización de la CPU, la utilización de la red y las comprobaciones de estado de las instancias. Si el desempeño no alcanza los valores del punto de referencia establecido, es posible que deba volver a configurar u optimizar la instancia para reducir la utilización de la CPU o reducir el tráfico de red. Si la instancia sigue funcionando por encima de los umbrales de uso de la CPU, es posible que desee cambiarse a un plan más grande para su instancia (utilice el plan de 7 USD al mes en lugar del plan de 5 USD al mes). Puede cambiar a un plan más grande creando una nueva instantánea de la instancia y, a continuación, creando una nueva instancia a partir de la instantánea con el plan más grande.

Una vez que haya establecido una línea base, puede configurar las alarmas en la consola de Lightsail para que le notifiquen cuando sus recursos superen los umbrales especificados. Para obtener más información, consulte Notificaciones y Alarmas.

Conceptos y terminología de métricas

La terminología y los conceptos siguientes le ayudarán a comprender mejor el uso de las métricas en Lightsail.

Métricas

Una métrica representa un conjunto de puntos de datos ordenados por tiempo. Una métrica es una variable que monitoriza, y los puntos de datos son los valores de esa variable a lo largo del tiempo. Las métricas se definen de forma única mediante un nombre. Por ejemplo, algunas métricas de instancia proporcionadas por Lightsail incluyen la utilización de la CPU CPUUtilization (), el tráfico de red entrante NetworkIn () y el tráfico de red saliente (). NetworkOut Para obtener más información sobre todas las métricas de recursos disponibles en Lightsail, consulte Métricas disponibles en Lightsail.

Retención de métricas

Los puntos de datos con un periodo de 60 segundos (resolución de 1 minuto) están disponibles durante 15 días. Los puntos de datos con un periodo de 300 segundos (resolución de 5 minutos) están disponibles durante 63 días. Los puntos de datos con un periodo de 3600 segundos (resolución de 1 hora) están disponibles para 455 días (15 meses).

Los puntos de datos que están disponibles inicialmente con un periodo más corto se acumulan para ser almacenados a largo plazo. Por ejemplo, los puntos de datos con una granularidad de 1 minuto permanecen disponibles durante 15 días con una resolución de 1 minuto. Después de 15 días estos datos siguen estando disponibles, pero se acumulan y solo se pueden recuperar con una resolución de 5 minutos. Después de 63 días, los datos siguen acumulándose y están disponibles con una resolución de 1 hora. Si necesita disponibilidad de métricas durante más tiempo que estos períodos, puede usar la API de Lightsail AWS Command Line Interface ,AWS CLI() y los SDK para recuperar los puntos de datos para almacenarlos fuera de línea o de otro modo.

Para obtener más información, consulte GetInstanceMetricData, GetBucketMetricDataGetLoadBalancerMetricDataGetDistributionMetricData, y GetRelationalDatabaseMetricDataen la referencia de la API de Lightsail.

Statistics

Las estadísticas métricas son el medio en el que los datos se agregan a lo largo de un periodo de tiempo. Las estadísticas de ejemplo incluyen Average, Sum, y Maximum. Por ejemplo, los datos de métrica de utilización de CPU de instancia se pueden promediar utilizando la estadística Average, las conexiones de base de datos se pueden agregar mediante la estadística Sum, el tiempo máximo de respuesta del balanceador de carga se puede recuperar mediante la estadística Maximum, etc.

Para obtener una lista de las estadísticas de métricas disponibles, consulte las estadísticas de GetInstanceMetricData, las estadísticas de GetBucketMetricData, las estadísticas de GetLoadBalancerMetricData y las estadísticas de GetRelationalDatabaseMetricData en la referencia de la API de Lightsail. GetDistributionMetricData

Unidades

Cada estadística tiene una unidad de medida. Entre las unidades de ejemplo se incluyen Bytes, Seconds, Count y Percent. Para ver la lista completa de unidades, consulte las unidades para GetInstanceMetricData, las unidades para GetLoadBalancerMetricData y las unidades para GetDistributionMetricData GetRelationalDatabaseMetricData en la referencia de la API de Lightsail.

Periodos

Un periodo es el tiempo asociado a un punto de datos específico (la granularidad de los puntos de datos devueltos). Cada punto de datos representa una suma de los datos de métrica recopilados durante un periodo de tiempo especificado. Los periodos se definen en segundos y los valores válidos para el periodo son cualquier múltiplo de 60 segundos (1 minuto) y 300 segundos (5 minutos).

Al recuperar puntos de datos mediante la API de Lightsail, puede especificar un período, una hora de inicio y una hora de finalización. Estos parámetros determinan la duración de tiempo total asociada al punto de datos. Lightsail informa los datos de las métricas en incrementos de 1 minuto o 5 minutos; por lo tanto, debe especificar los períodos en múltiplos de 60 segundos y 300 segundos. Los valores que especifique para la hora de inicio y la hora de finalización determinan cuántos períodos devuelve Lightsail. Si prefiere estadísticas acumuladas en bloques de diez minutos, especifique un periodo de 600. Para estadísticas acumuladas en toda la hora, especifique un periodo de 3600, etc.

Los períodos también son importantes para las alarmas Lightsail. Lightsail evalúa los puntos de datos de las alarmas cada 5 minutos, y cada punto de datos de las alarmas representa un período de 5 minutos de datos agregados. Cuando crea una alarma para monitorear una métrica específica, le pide a Lightsail que compare esa métrica con el valor de umbral que especifique. Usted tiene un amplio control sobre la forma en que Lightsail hace esa comparación. Puede especificar el periodo durante el cual se realiza la comparación y también especificar cuántos periodos de evaluación se utilizan para llegar a una conclusión. Para obtener más información, consulte Alarmas.

Alarmas

Una alarma vigila una sola métrica durante un periodo de tiempo especificado y le notifica cuando la métrica cruza un umbral especificado. La notificación puede ser un banner que se muestra en la consola de Lightsail, un correo electrónico enviado a la dirección de correo electrónico que haya especificado y un mensaje de texto SMS enviado a un número de teléfono móvil que haya especificado. Para obtener más información, consulte Alarmas.

Métricas disponibles en Lightsail

Métricas de la instancia

Las siguientes métricas de instancias únicas están disponibles. Para obtener más información, consulte Visualización de métricas de instancias en Amazon Lightsail.

  • Uso de la CPU (CPUUtilization): porcentaje de unidades de computación asignadas que están actualmente en uso en la instancia. Esta métrica identifica la potencia de procesamiento para ejecutar las aplicaciones en la instancia. Las herramientas de su sistema operativo pueden mostrar un porcentaje inferior al de Lightsail cuando la instancia no tiene asignado un núcleo de procesador completo.

    Al ver los gráficos de métricas de uso de la CPU de sus instancias en la consola Lightsail, verá zonas sostenibles y estables. Para obtener más información acerca de lo que significan estas zonas, consulte Zonas sostenibles y con ráfagas de utilización de CPU.

  • Capacidad de ampliación en minutos (BurstCapacityTime) y porcentaje (BurstCapacityPercentage): los minutos de capacidad de ampliación representan la cantidad de tiempo disponible para que la instancia se amplíe al 100 % de uso de la CPU. El porcentaje de capacidad de ampliación es el porcentaje de rendimiento de la CPU disponible para su instancia. La instancia consume y acumula capacidad de ráfaga continuamente. Los minutos de capacidad de ampliación se consumen plenamente solo cuando la instancia funciona con una utilización de la CPU del 100 %. Para obtener más información sobre la capacidad de ráfagas de instancias, consulte Visualización de la capacidad de ráfagas de instancias en Amazon Lightsail.

  • Tráfico de red entrante (NetworkIn): número de bytes que la instancia recibe en todas las interfaces de red. Esta métrica identifica el volumen de tráfico de red entrante de la instancia. El número registrado es el número de bytes recibidos durante el periodo. Dado que esta métrica se notifica en intervalos de 5 minutos, divida el número notificado por 300 para buscar bytes/segundo.

  • Tráfico de red saliente (NetworkOut): número de bytes que la instancia envía en todas las interfaces de red. Esta métrica identifica el volumen de tráfico de red saliente de la instancia. El número registrado es el número de bytes enviados durante el periodo. Dado que esta métrica se notifica en intervalos de 5 minutos, divida el número notificado por 300 para buscar bytes/segundo.

  • Errores de verificación de estado (StatusCheckFailed): indica si la instancia ha superado o no tanto la comprobación de su estado como la comprobación de estado del sistema. Esta métrica puede ser 0 (superada) o 1 (no superada). Esta métrica está disponible con una frecuencia de 1 minuto.

  • Errores de verificación del estado de la instancia (StatusCheckFailed_Instance): indica si la instancia ha superado o no la comprobación de su estado. Esta métrica puede ser 0 (superada) o 1 (no superada). Esta métrica está disponible con una frecuencia de 1 minuto.

  • Errores de verificación del estado de sistema (StatusCheckFailed_System): indica si la instancia ha superado o no la comprobación de estado del sistema. Esta métrica puede ser 0 (superada) o 1 (no superada). Esta métrica está disponible con una frecuencia de 1 minuto.

  • No hay solicitudes de metadatos de tokens (MetadataNoToken): el número de veces que se ha accedido correctamente al servicio de metadatos de instancia sin un token. Esta métrica determina si hay procesos que acceden a metadatos de instancia mediante el servicio de metadatos de instancia versión 1, el cual no usa un token. Si todas las solicitudes usan sesiones basadas en token, como por ejemplo el servicio de metadatos de instancia versión 2, el valor es 0. Para obtener más información, consulte Metadatos de instancia y datos de usuario en Amazon Lightsail.

Métricas de bases de datos

Las siguientes métricas de base de datos están disponibles. Para obtener más información, consulte Visualización de métricas de bases de datos en Amazon Lightsail.

  • Uso de la CPU (CPUUtilization): porcentaje de uso de la CPU actualmente en uso en la base de datos.

  • Conexiones de base de datos (DatabaseConnections): número de conexiones a la base de datos en uso.

  • Profundidad de la cola del disco (DiskQueueDepth): número de E/S (solicitudes de lectura/escritura) pendientes a la espera de obtener acceso al disco.

  • Espacio de almacenamiento libre (FreeStorageSpace): cantidad de espacio de almacenamiento disponible.

  • Rendimiento de recepción de red (NetworkReceiveThroughput): tráfico de red de entrada (recepción) en la base de datos, incluido el tráfico de base de datos del cliente y el tráfico de AWS utilizado en la supervisión y la replicación.

  • Rendimiento de la transmisión de red (NetworkTransmitThroughput): tráfico de red de salida (transmisión) en la base de datos, incluido el tráfico de base de datos del cliente y el tráfico de AWS utilizado en la supervisión y la replicación.

Métricas de distribución

Están disponibles las siguientes métricas de distribución. Para obtener más información, consulte Visualización de las métricas de distribución en Amazon Lightsail.

  • Solicitudes (Requests): la cantidad total de solicitudes de lector recibidas por la distribución para todos los métodos HTTP y para las solicitudes HTTP y HTTPS.

  • Bytes cargados (BytesUploaded): el número de bytes cargados en el origen por la distribución mediante solicitudes POST y PUT.

  • Bytes descargados (BytesDownloaded): el número de bytes descargados por los lectores para las solicitudes GET, HEAD y OPTIONS.

  • Tasa de errores total (TotalErrorRate): porcentaje de todas las solicitudes de lector para las cuales el código de estado HTTP de la respuesta fue 4xx o 5xx.

  • Tasa de errores HTTP 4xx (4xxErrorRate): porcentaje de todas las solicitudes de lector para las cuales el código de estado HTTP de la respuesta fue 4xx. En estos casos, el cliente o el lector del cliente pueden haber cometido un error. Por ejemplo, un código de estado de 404 (No encontrado) significa que el cliente solicitó un objeto que no se pudo encontrar.

  • Tasa de errores HTTP 5xx (5xxErrorRate): porcentaje de todas las solicitudes de lector para las cuales el código de estado HTTP de la respuesta fue 5xx. En estos casos, el servidor de origen no cumplió con la solicitud. Por ejemplo, un código de estado de 503 (Servicio no disponible) significa que el servidor de origen no está disponible en ese momento.

Métricas del equilibrador de carga

Las siguientes métricas del balanceador de carga están disponibles. Para obtener más información, consulte Visualización de las métricas del balanceador de carga en Amazon Lightsail.

  • Recuento de hosts en buen estado (HealthyHostCount): cantidad de instancias de destino que se considera que están en buen estado.

  • Recuento de hosts en mal estado (UnhealthyHostCount): cantidad de instancias de destino que se considera que están en mal estado.

  • Equilibrador de carga HTTP 4XX (HTTPCode_LB_4XX_Count): cantidad de códigos de error del cliente HTTP 4XX que proceden del equilibrador de carga. Los errores del cliente se generan cuando las solicitudes no tienen el formato correcto o están incompletas. Estas solicitudes no fueron recibidas por la instancia de destino. Este número no incluye códigos de respuesta generados por las instancias de destino.

  • Equilibrador de carga HTTP 5XX (HTTPCode_LB_5XX_Count): cantidad de códigos de error del servidor HTTP 5XX que proceden del equilibrador de carga. Esto no incluye los códigos de respuesta generados por la instancia de destino. Esta métrica se registra si no hay ninguna instancia en buen estado asociada al balanceador de carga o si la tasa de solicitudes supera la capacidad de las instancias o del balanceador de carga.

  • Instancia HTTP 2XX (HTTPCode_Instance_2XX_Count): cantidad de códigos de respuesta HTTP 2XX generados por las instancias de destino. Este número no incluye los códigos de respuesta generados por el equilibrador de carga.

  • Instancia HTTP 3XX (HTTPCode_Instance_3XX_Count): cantidad de códigos de respuesta HTTP 3XX generados por las instancias de destino. Este número no incluye los códigos de respuesta generados por el equilibrador de carga.

  • Instancia HTTP 4XX (HTTPCode_Instance_4XX_Count): cantidad de códigos de respuesta HTTP 4XX generados por las instancias de destino. Este número no incluye los códigos de respuesta generados por el equilibrador de carga.

  • Instancia HTTP 5XX (HTTPCode_Instance_5XX_Count): cantidad de códigos de respuesta HTTP 5XX generados por las instancias de destino. Este número no incluye los códigos de respuesta generados por el equilibrador de carga.

  • Tiempo de respuesta de instancia (InstanceResponseTime): tiempo transcurrido, en segundos, después de que la solicitud abandona el equilibrador de carga hasta que se recibe una respuesta de la instancia de destino.

  • Recuento de errores de negociación TLS del cliente (ClientTLSNegotiationErrorCount): cantidad de conexiones TLS iniciadas por el cliente que no establecieron una sesión con el equilibrador de carga debido a un error TLS generado por el equilibrador de carga. Las causas posibles incluyen una discrepancia de los cifrados o los protocolos.

  • Recuento de solicitudes (RequestCount): cantidad de solicitudes procesadas sobre IPv4. Este número solo incluye las solicitudes con una respuesta generadas por una instancia de destino del balanceador de carga.

  • Recuento de conexiones rechazadas (RejectedConnectionCount): cantidad de conexiones que se rechazaron debido a que el equilibrador de carga ha alcanzado su número máximo de conexiones.

Métricas del servicio de contenedores

Están disponibles las siguientes métricas del servicio de contenedores. Para obtener más información, consulte Visualización de métricas del servicio de contenedores.

  • Uso de la CPU (CPUUtilization): el porcentaje medio de unidades de computación que están actualmente en uso en todos los nodos del servicio de contenedores. Esta métrica identifica la capacidad de procesamiento necesaria para ejecutar contenedores en el servicio de contenedores.

  • Uso de la memoria (MemoryUtilization): el porcentaje medio de memoria que está actualmente en uso en todos los nodos del servicio de contenedores. Esta métrica identifica la memoria necesaria para ejecutar contenedores en el servicio de contenedores.

Métricas de bucket

Están disponibles las siguientes métricas de buckets. Para obtener más información, consulte Visualización de las métricas de los buckets en Amazon Lightsail.

  • Tamaño del bucket (BucketSizeBytes): la cantidad de datos almacenados en un bucket. Este valor se calcula sumando el tamaño de todos los objetos del bucket (tanto los objetos actuales como los no actuales), incluido el tamaño de todas las partes correspondientes a todas las cargas multiparte incompletas en el grupo.

  • Número de objetos (NumberOfObjects): la cantidad total de objetos almacenados en un bucket. Este valor se calcula contando todos los objetos en el bucket (objetos actuales y no actuales) y el número total de partes correspondientes a todas las cargas de multiparte incompletas en el bucket.

nota

Los datos de las métricas de bucket no se notifican cuando el bucket está vacío.