PERF04-BP06 Elegir la ubicación de la carga de trabajo en función de los requisitos de la red
Evalúe las opciones de colocación de recursos para reducir la latencia de la red y mejorar el rendimiento, lo que proporcionará una experiencia de usuario óptima al reducir los tiempos de carga de las páginas y de transferencia de datos.
Patrones comunes de uso no recomendados:
-
Consolida todos los recursos de la carga de trabajo en una ubicación geográfica.
-
Ha elegido la región más cercana a su ubicación, pero no al usuario final de la carga de trabajo.
Beneficios de establecer esta práctica recomendada: La experiencia del usuario se ve muy afectada por la latencia entre el usuario y la aplicación. Al utilizar las Regiones de AWS adecuadas y la red global privada de AWS, puede reducir la latencia y ofrecer una mejor experiencia a los usuarios remotos.
Nivel de riesgo expuesto si no se establece esta práctica recomendada: Medio
Guía para la implementación
Los recursos, como las instancias de Amazon EC2, se colocan en zonas de disponibilidad dentro de Regiones de AWS
Amazon EC2 ofrece grupos de colocación para la creación de redes. Un grupo de registro es una agrupación lógica de instancias para reducir la latencia. El uso de grupos de colocación con tipos de instancias compatibles y un Elastic Network Adapter (ENA) permite que las cargas de trabajo participen en una red de 25 Gbps de baja latencia y fluctuación reducida. Se recomiendan grupos de colocación para cargas de trabajo que aprovechan la baja latencia de red, el alto rendimiento de red o ambos.
Los servicios sensibles a la latencia se prestan en ubicaciones periféricas mediante una red global de AWS, como Amazon CloudFront
Utilice los servicios periféricos para reducir la latencia y permitir el almacenamiento en caché del contenido. Configure correctamente el control de caché para DNS y HTTP/HTTPS a fin de obtener el mayor beneficio de estos enfoques.
Pasos para la implementación
-
Recoja información sobre el tráfico IP que entra y sale de las interfaces de red.
-
Analice los patrones de acceso de la red en su carga de trabajo para identificar cómo utilizan los usuarios su aplicación.
-
Use herramientas de monitorización como Amazon CloudWatch
y AWS CloudTrail para recopilar datos sobre las actividades de la red. -
Analice los datos para identificar el patrón de acceso de la red.
-
-
Seleccione regiones para el despliegue de la carga de trabajo en función de los siguientes elementos clave:
-
Dónde se encuentran sus datos: en el caso de las aplicaciones con gran cantidad de datos (como macrodatos y machine learning), el código de la aplicación debe ejecutarse lo más cerca posible de los datos.
-
Dónde se encuentran sus usuarios: para las aplicaciones orientadas al usuario, elija una región (o regiones) cercana a los usuarios de su carga de trabajo.
-
Otras restricciones: tenga en cuenta restricciones como el coste y el cumplimiento como se explica en Qué tener en cuenta al seleccionar una región para las cargas de trabajo.
-
-
Utilice Zonas locales de AWS
para ejecutar cargas de trabajo como la renderización de vídeo. Las zonas locales le permiten beneficiarse de tener recursos de computación y almacenamiento más cerca de los usuarios finales. -
Utilice AWS Outposts
para cargas de trabajo que deban seguir siendo locales y en las que desee que esa carga de trabajo se ejecute sin problemas con el resto de sus demás cargas de trabajo en AWS. -
Aplicaciones como la transmisión de vídeo en directo de alta resolución, audio de alta fidelidad y realidad aumentada/realidad virtual (RA/RV) requieren una latencia ultrabaja para dispositivos 5G. Para este tipo de aplicaciones, considere AWS Wavelength
. AWS Wavelength integra los servicios de computación y almacenamiento de AWS en las redes 5G, proporcionando una infraestructura de computación periférica móvil para desarrollar, desplegar y escalar aplicaciones de ultrabaja latencia. -
Utilice almacenamiento en caché local o Soluciones de almacenamiento en caché de AWS
para los recursos de uso frecuente con el fin de mejorar el rendimiento, reducir el movimiento de datos y disminuir el impacto medioambiental. Servicio Cuándo usar Se usa para almacenar en caché el contenido estático como imágenes, scripts y vídeos, así como el contenido dinámico como respuestas de API y aplicaciones web.
Se usa para almacenar en caché el contenido de las aplicaciones web.
Se usa para añadir aceleración en memoria a sus tablas de DynamoDB.
-
Utilice servicios que puedan ayudarle a ejecutar el código más cerca de los usuarios de su carga de trabajo, como estas:
Servicio Cuándo usar Se usa para las operaciones que utilizan muchos recursos de computación que se inician cuando los objetos no están en la memoria caché.
Se usan para casos de uso sencillos como las manipulaciones de solicitudes o respuestas HTTP(s) que pueden iniciarse mediante funciones de corta duración.
Se usa para ejecutar la computación local, la mensajería y el almacenamiento en caché de datos para los dispositivos conectados.
-
Algunas aplicaciones requieren puntos de entrada fijos o un mayor rendimiento mediante el aumento del rendimiento y la reducción de la fluctuación y de la latencia del primer byte. Estas aplicaciones pueden beneficiarse de los servicios de red que proporcionan direcciones IP estáticas de difusión por proximidad y terminación TCP en ubicaciones periféricas. AWS Global Accelerator
puede mejorar el rendimiento de las aplicaciones hasta en un 60 % y proporcionar una rápida conmutación por error para arquitecturas multirregión. AWS Global Accelerator le proporciona direcciones IP estáticas de difusión por proximidad que sirven como punto de entrada fijo para las aplicaciones alojadas en una o más Regiones de AWS. Estas direcciones IP permiten que el tráfico entre en la red global de AWS lo más cerca posible de sus usuarios. AWS Global Accelerator reduce el tiempo de configuración de la conexión inicial al establecer una conexión TCP entre el cliente y la ubicación periférica de AWS más cercana al cliente. Revise el uso de AWS Global Accelerator para mejorar el rendimiento de sus cargas de trabajo TCP/UDP y proporcionar una rápida conmutación por error para arquitecturas multirregión.
Recursos
Prácticas recomendadas relacionadas:
Documentos relacionados:
Vídeos relacionados:
-
AWS re:Invent 2021 - AWS Outposts: Bringing the AWS experience on premises
-
AWS re:Invent 2020: AWS Wavelength: Run apps with ultra-low latency at 5G edge
-
AWS re:Invent 2022 - AWS Local Zones: Building applications for a distributed edge
-
AWS re:Invent 2021 - Building low-latency websites with Amazon CloudFront
-
AWS re:Invent 2022 - Improve performance and availability with AWS Global Accelerator
-
AWS re:Invent 2022 - Build your global wide area network using AWS
-
AWS re:Invent 2020: Global traffic management with Amazon Route 53
Ejemplos relacionados: