Funcionamiento de Amazon CloudWatch Internet Monitor - Amazon CloudWatch

Funcionamiento de Amazon CloudWatch Internet Monitor

En esta sección, se proporciona información sobre el funcionamiento de Amazon CloudWatch Internet Monitor. Esto incluye descripciones de cómo AWS recopila los datos que utilice para ayudar a detectar problemas de conectividad en Internet y cómo se calculan las puntuaciones de rendimiento y disponibilidad.

Contenido

Cómo Internet Monitor se centra únicamente en la huella de tráfico de sus aplicaciones

Internet Monitor centra la supervisión en solo el subconjunto de Internet al que acceden los usuarios de sus recursos de AWS, en lugar de supervisar ampliamente su sitio web desde todas las regiones del mundo, como hacen otras herramientas. También es una solución rentable y asequible para grandes y pequeñas empresas.

Internet Monitor utiliza los mismos potentes sondeos y algoritmos de detección de problemas que AWS aprovecha internamente para enviarle alertas de los problemas de conectividad que afecten a su aplicación mediante la creación de eventos de estado en Internet Monitor. A continuación, Internet Monitor le da acceso al mapa de rendimiento y disponibilidad resultante, al superponer el perfil de tráfico que cree a partir de sus espectadores activos, en función de los recursos de la aplicación.

Con esta información, Internet Monitor le muestra solo los eventos relevantes (es decir, los eventos de los lugares donde tiene espectadores activos) y únicamente el impacto que esos eventos tienen en su volumen total de espectadores. Por lo tanto, el impacto que tiene un evento, en términos de porcentajes, se basa en el tráfico total en todo el mundo.

Internet Monitor publica las mediciones de Internet en registros de CloudWatch cada cinco minutos para las 500 principales redes urbanas (ubicaciones de clientes y ASN, normalmente proveedores de servicios de Internet o ISP) que envían tráfico a cada monitor. Si lo desea, puede optar por publicar las mediciones de Internet de todas las redes urbanas supervisadas (hasta el límite de servicio de 500 000 redes urbanas) en un bucket de Amazon S3. Para obtener más información, consulte Publicar mediciones de Internet en Amazon S3 en Amazon CloudWatch Internet Monitor.

Algunas de las ventajas de Internet Monitor son las siguientes:

  • El uso de Internet Monitor no supone una carga ni un costo adicionales para la aplicación alojada en AWS.

  • No tiene que incluir código de medición del rendimiento en los recursos del lado del cliente ni en la aplicación.

  • Puede ver el rendimiento y la disponibilidad en Internet a la que esté conectada su aplicación, incluida la información sobre los usuarios finales.

Tenga en cuenta que, dado que Internet Monitor crea mediciones en función de sus recursos de AWS, Internet Monitor solo crea eventos que sean específicos del tráfico de su aplicación. No se informa sobre problemas globales de Internet en general. Además, cuando la ubicación del servicio es una región de Región de AWS, las mediciones y los eventos emitidos están diseñados para representar la conectividad en un ámbito regional y no representan con precisión la conectividad entre una ubicación de usuario final y una zona de disponibilidad.

Cómo AWS mide los problemas de conectividad y calcula las medidas

Amazon CloudWatch Internet Monitor utiliza los datos de conectividad a Internet entre diferentes Regiones de AWS y puntos de presencia (POP) de Amazon CloudFront con diferentes ubicaciones de clientes a través de números de sistema autónomos (ASN), normalmente proveedores de servicios de Internet (ISP). Estos son los datos de conectividad que los operadores de AWS utilizan internamente cada día para detectar de forma proactiva problemas de conectividad en Internet en todo el mundo.

Para cada región de Región de AWS, sabemos qué partes de Internet se comunican con la región y hacemos lo siguiente:

  • Supervisamos activamente esas partes de Internet, con un período continuo de 30 días.

  • Utilizamos sondeos de red y de protocolo de nivel superior, así como sondeos entrantes y salientes.

AWS cuenta con sondas activas y pasivas que miden la latencia (rendimiento) en el percentil 90 y la accesibilidad (disponibilidad) desde todas las regiones de Región de AWS y desde el servicio de CloudFront hacia todo Internet. Los patrones anormales de conectividad entre un servicio y la ubicación de un cliente se supervisan y, luego, se notifican al cliente en forma de alertas.

Cómo calcular la disponibilidad y el RTT

El tiempo de ida y vuelta (RTT) es el tiempo que tarda una solicitud del usuario en devolverle una respuesta. Cuando se agrega el tiempo de ida y vuelta entre las ubicaciones de los usuarios finales, el valor se pondera en función de la cantidad de tráfico generado por cada ubicación de usuario final.

Por ejemplo, con dos ubicaciones de usuarios finales, una que atiende el 90 % del tráfico con un RTT de 5 ms y la otra que atiende el 10 % del tráfico con un RTT de 10 ms, el resultado es un RTT agregado de 5,5 ms (que proviene de 5 ms * 0,9 + 10 ms * 0,1).

Tenga en cuenta que existen diferencias en los recursos sobre la medición de la latencia de última milla. Para las mediciones de latencia de Internet Monitor, los directorios de VPC, Equilibradores de carga de red y WorkSpaces no incluyen la latencia de última milla.

Cómo calcular el rendimiento y la disponibilidad

AWS tiene datos históricos sustanciales sobre el rendimiento y la disponibilidad de Internet entre los servicios de AWS y las distintas redes urbanas (ubicaciones y ASN). Al aplicar análisis estadísticos a los datos, podemos detectar cuándo el rendimiento y la disponibilidad de su aplicación han disminuido en comparación con una base de referencia estimada que se ha calculado. Para que le resulte más fácil ver esas caídas, esa información se le presenta en forma de puntuaciones de estado: una puntuación de rendimiento y una puntuación de disponibilidad.

Las puntuaciones de estado se calculan con diferentes niveles de detalle. Con el máximo detalle, calculamos la puntuación de estado de una región geográfica, como una ciudad o un área metropolitana, y de un ASN (una ciudad urbana). También agrupamos las puntuaciones de estado individuales en números de puntuación de estado globales para aplicarlas en un monitor. Si consulta las puntuaciones de rendimiento o disponibilidad sin filtrar por una ubicación geográfica o un proveedor de servicios específicos, Internet Monitor proporciona puntuaciones de estado globales.

Las puntuaciones de estado globales abarcan toda la aplicación durante el período de tiempo especificado. Cuando la puntuación de rendimiento o disponibilidad de los pares de ciudades y redes de la aplicación en toda la aplicación alcanza o cae por debajo del umbral de eventos de estado correspondiente al rendimiento o la disponibilidad, Internet Monitor desencadena un evento de estado. De forma predeterminada, el umbral es del 95 % tanto para el rendimiento general como para la disponibilidad. Internet Monitor también crea eventos de estado en función de los umbrales locales (si la opción está habilitada, como lo está de forma predeterminada) en función de los valores que se configuren. Para obtener más información sobre la configuración de los umbrales, consulte Cambiar los umbrales de los eventos de estado.

Cuando explore la información del monitor y los archivos de registro para investigar los problemas y obtener más información, puede filtrar por ciudad (ubicación) y red (ASN o proveedor de servicios de Internet), o por ambos. Por lo tanto, puede usar filtros para ver las puntuaciones de estado de diferentes ciudades, ASN o pares de ciudades y redes, según los filtros que elija.

  • Una puntuación de disponibilidad representa el porcentaje estimado de tráfico que no sufre una caída en la disponibilidad. Internet Monitor calcula el porcentaje de tráfico que experimenta una caída con respecto al tráfico total visto y a las mediciones de las métricas de disponibilidad. Por ejemplo, una puntuación de disponibilidad del 99 % para un par de usuarios finales y ubicaciones de servicios equivale a un 1 % de tráfico que experimenta una caída de disponibilidad para ese par.

  • Una puntuación de rendimiento representa el porcentaje de tráfico que no experimenta una caída en el rendimiento. Por ejemplo, una puntuación de rendimiento del 99 % para un par de usuarios finales y ubicaciones de servicios equivale a un 1 % de tráfico que experimenta una caída de rendimiento para ese par.

Cómo calcular el TTFB y el RTT (latencia)

El tiempo hasta el primer byte (TTFB) se refiere al tiempo que transcurre entre el momento en el que el cliente realiza una solicitud y el momento en el que se recibe el primer byte de información del servidor. Los cálculos de TTFB de AWS miden el tiempo transcurrido desde Amazon EC2 o Amazon CloudFront hasta el nodo de medición de Internet Monitor (incluida la última milla del nodo). Es decir, Internet Monitor mide el tiempo que pasa desde el usuario hasta la región Amazon EC2 para TTFB para EC2 y desde el usuario hasta CloudFront para TTFB para CloudFront.

En el caso del tiempo de ida y vuelta (RTT), Internet Monitor incluye el tiempo transcurrido desde la red urbana (es decir, la ubicación del cliente y el ASN, normalmente un proveedor de servicios de Internet), mapeado por la dirección IP pública, hasta la Región de AWS. Esto significa que Internet Monitor no tiene visibilidad de última milla para los usuarios que acceden a Internet desde una puerta de enlace o una VPN.

Tenga en cuenta que existen diferencias en los recursos sobre la medición de la latencia de última milla. Para las mediciones de latencia de Internet Monitor, los directorios de VPC, Equilibradores de carga de red y WorkSpaces no incluyen la latencia de última milla.

Internet Monitor incluye información promedio de TTFB en la sección de sugerencias de optimización del tráfico de la pestaña Información sobre el tráfico del panel de CloudWatch, para ayudarle a evaluar las opciones para las diferentes configuraciones de su aplicación que pueden mejorar el rendimiento.

Mediciones y agregaciones regionales y de zonas de disponibilidad

Si bien Internet Monitor agrega las mediciones y comparte el impacto a nivel regional, calcula el impacto a nivel de zona de disponibilidad (AZ). Esto significa que, si en el caso de un evento, solo se ve afectada una zona de disponibilidad y la mayor parte del tráfico fluye a través de esa zona, verá el impacto en su tráfico. Sin embargo, en el mismo caso, si el tráfico de su aplicación no fluye a través de una zona de disponibilidad afectada, no verá ningún impacto.

Tenga en cuenta que esto solo se aplica a los recursos que no son directorios de WorkSpaces. Los directorios de WorkSpaces se miden solo a nivel regional.

Precisión de la geolocalización en Internet Monitor

Para obtener información sobre la ubicación, Internet Monitor utiliza los datos de geolocalización IP proporcionados por MaxMind. La precisión de la información de ubicación en las mediciones del Monitor de Internet depende de la precisión de los datos de MaxMind.

Tenga en cuenta que las mediciones de nivel de Metro pueden no ser precisas en ubicaciones fuera de los Estados Unidos.

Cuándo Internet Monitor crea y resuelve eventos de estado

Internet Monitor crea y cierra los eventos de estado del tráfico de las aplicaciones que usted supervisa en función de los umbrales actuales establecidos. Internet Monitor tiene una configuración de umbrales predeterminada y también puede establecer su propia configuración para los umbrales. Internet Monitor determina el impacto general que los problemas de conectividad están teniendo en la aplicación y el impacto en las áreas locales donde la aplicación tiene clientes, y crea eventos de estado cuando se superan los umbrales.

Internet Monitor calcula el impacto de los problemas de conectividad en la ubicación de un cliente a partir de los datos históricos sobre el rendimiento de Internet y la disponibilidad del tráfico de red que esté disponible para el servicio mediante AWS. Aplica la información relevante para su aplicación en función de las ubicaciones geográficas de los ASN y los servicios en los que los clientes utilizan su aplicación: los pares de ciudades y redes que se ven afectados. Las ubicaciones se determinan a partir de los recursos que se agreguen al monitor. Internet Monitor utiliza análisis estadístico para detectar el descenso del rendimiento y la disponibilidad, lo que afecta a la experiencia del cliente de la aplicación.

Las puntuaciones de rendimiento y disponibilidad que calcula Internet Monitor se representan como el porcentaje del tráfico que no experimenta ninguna caída. El impacto es lo contrario de esto: es una representación de la gravedad de un problema para los usuarios finales de un cliente. Por lo tanto, si se produce una caída de la disponibilidad global del 93 %, por ejemplo, el impacto correspondiente sería del 7 %.

Cuando la puntuación de rendimiento o disponibilidad de los pares de ciudades y redes de la aplicación alcanza o cae globalmente por debajo del umbral de eventos de estado correspondiente al rendimiento o la disponibilidad, Internet Monitor desencadena un evento de estado. De forma predeterminada, el umbral es del 95 % tanto para el rendimiento como para la disponibilidad. Los valores para alcanzar el umbral o caer por debajo de él son acumulativos, por lo que podría significar que varios eventos más pequeños se combinan para alcanzar el porcentaje del umbral o que un solo evento alcanza o cae por debajo del nivel umbral.

Mientras las puntuaciones de rendimiento o disponibilidad que desencadenaron el evento sean iguales o inferiores al porcentaje del umbral de impacto global correspondiente, el evento de estado permanecerá activo. Cuando la puntuación o las puntuaciones combinadas que desencadenaron el evento superan el umbral, Internet Monitor resuelve el problema de estado.

Internet Monitor también crea eventos de estado en función de los umbrales locales y del porcentaje del tráfico total al que afecta un problema. Puede configurar opciones para los umbrales locales o desactivarlos por completo.

Para obtener más información sobre la configuración de los umbrales, consulte Cambiar los umbrales de los eventos de estado.

Calendario de informes de eventos de estado

Internet Monitor utiliza un agregador para recopilar todas las señales sobre problemas de Internet y crear eventos de estado en los monitores en cuestión de minutos.

Cuando es posible, Internet Monitor analiza el origen de un evento de estado para determinar si fue causado por AWS o un ASN. El análisis de los eventos de estado continúa después de que se resuelva un evento. Internet Monitor puede actualizar los eventos con nueva información durante un máximo de una hora.

Cómo funciona Internet Monitor con el tráfico de IPv4 e IPv6

Internet Monitor mide el estado de una red únicamente a través de IPv4 y le muestra los eventos de estado y las métricas de disponibilidad y rendimiento si envía tráfico a esa red a través de cualquier familia de IP (IPv4 o IPv6). Si atiende el tráfico desde un recurso de doble pila, como una distribución de CloudFront de doble pila, Internet Monitor genera un problema de estado y muestra una caída en la puntuación de rendimiento o disponibilidad solo si el tráfico IPv4 presenta los mismos problemas para el recurso que el tráfico IPv6.

Tenga en cuenta que las métricas de Internet Monitor para el total de bytes de entrada y salida reflejan con precisión todo el tráfico de Internet (IPv4 e IPv6).

Cómo Internet Monitor selecciona el subconjunto de redes urbanas que desea incluir

Al establecer un límite máximo para el número de redes urbanas supervisadas por el monitor o al elegir un porcentaje del tráfico a supervisar, Internet Monitor selecciona las redes urbanas que se incluirán (supervisarán) según el volumen de tráfico reciente más alto.

Por ejemplo, si establece un límite máximo de 100 redes urbanas, Internet Monitor supervisará hasta 100 redes urbanas según el tráfico de sus aplicaciones durante un período reciente de una hora. Concretamente, Internet Monitor supervisa las 100 principales redes urbanas que han tenido más tráfico en el último período de una hora antes del último período de una hora.

Para ilustrarlo, supongamos que la hora actual son las 14:30 h. En este escenario, el tráfico que ve en el monitor se capturó entre las 13:00 h y las 14:00 h, y la medición del volumen de tráfico que Internet Monitor utiliza para determinar las 100 principales redes urbanas se capturó entre las 12:00 h y las 13:00 h.

Cómo se crea el mapa meteorológico mundial de Internet (preguntas frecuentes)

El mapa meteorológico de Internet de Amazon CloudWatch Internet Monitor está disponible en la consola de Internet Monitor para todos los clientes autenticados de AWS. En esta sección se incluyen detalles sobre cómo se crea el mapa meteorológico de Internet y cómo usarlo.

¿Qué es el mapa meteorológico de Internet de Internet Monitor?

El mapa meteorológico de Internet proporciona una representación visual e interactiva de los problemas de Internet en todo el mundo. Destaca las ubicaciones de los clientes afectados, es decir, las ciudades y las ASN (normalmente proveedores de servicios de Internet). El mapa muestra una combinación de problemas de disponibilidad y rendimiento que han afectado recientemente a la experiencia de Internet de los clientes en sus principales ubicaciones y los servicios de AWS de todo el mundo.

¿De dónde provienen los datos del mapa?

Los datos se basan en una combinación de exploraciones activas y pasivas de Internet. Para obtener más información sobre cómo Internet Monitor mide los datos, consulte la sección Cómo AWS mide los problemas de conectividad.

¿Con qué frecuencia se actualiza el mapa?

El mapa meteorológico de Internet se actualiza cada 15 minutos.

¿De qué redes se realiza un seguimiento de las interrupciones?

AWS rastrea redes en todo el mundo que representan prefijos IP importantes utilizados por los clientes para realizar conexiones de Internet a AWS. Abarcamos las interrupciones en las ubicaciones de los clientes que son las más importantes en cuanto al volumen de tráfico enviado y recibido desde la red de AWS.

¿Qué determina si un evento de Internet se incluye en el mapa?

Estos son algunos criterios generales que utilizamos para determinar si un evento de Internet se incluye en el mapa meteorológico de Internet:

  • AWS detecta que hay un evento de disponibilidad o rendimiento.

  • Si el evento es de corta duración, por ejemplo, dura menos de 5 minutos, lo ignoramos.

  • Entonces, si el evento se produce en la ubicación de un cliente que está clasificada como una de las más visitadas, se considera una interrupción.

¿Qué umbrales se utilizan para el mapa meteorológico de Internet?

Los umbrales para determinar las interrupciones no son estáticos en el mapa meteorológico de Internet. Internet Monitor determina lo que constituye un evento basándose en la detección de una desviación de los valores esperados. Para obtener más información sobre cómo funciona esto, consulte cómo Internet Monitor determina cuándo se deben crear eventos de estado para los monitores que se crean con el servicio. Al crear un monitor, Internet Monitor genera mediciones del estado del tráfico de Internet que son específicas del tráfico de su propia aplicación. Internet Monitor también le avisa de problemas de estado que afectan al tráfico de Internet de su aplicación.

¿Qué puedo hacer con estos datos?

El mapa meteorológico de Internet proporciona un resumen rápido de los principales eventos de Internet que se han producido en todo el mundo en las últimas 24 horas. Le ayuda a hacerse una idea de la experiencia de supervisión de Internet, sin necesidad de incorporar su propio tráfico de Internet a Internet Monitor. Para aprovechar todo el potencial de las capacidades de supervisión de Internet de AWS y personalizarlas para sus aplicaciones y servicios alojados en AWS, puede crear un monitor en Internet Monitor.

Al crear un monitor, permite que Internet Monitor identifique las rutas de Internet específicas que afectan a los clientes de sus aplicaciones y obtiene acceso a características y capacidades que pueden ayudarle a mejorar la experiencia de sus clientes. También recibirá notificaciones proactivas de los nuevos problemas de Internet que afecten específicamente al tráfico y a los clientes de sus aplicaciones.

¿Cómo puedo obtener más información sobre los eventos?

Haga clic en una interrupción en el mapa para ver detalles como cuándo comenzó y terminó el evento, la ciudad y los ASN afectados, y el tipo de problema (es decir, un problema de rendimiento o un problema de disponibilidad).

Para obtener información más detallada sobre los eventos y mediciones personalizadas del tráfico de sus aplicaciones, cree un monitor en Internet Monitor.