PERF04-BP06 Elegir la ubicación de la carga de trabajo en función de los requisitos de la red
Evalúe las opciones de colocación de recursos para reducir la latencia de la red y mejorar el rendimiento, lo que proporcionará una experiencia de usuario óptima al reducir los tiempos de carga de las páginas y de transferencia de datos.
Antipatrones usuales:
-
Consolida todos los recursos de la carga de trabajo en una ubicación geográfica.
-
Ha elegido la región más cercana a su ubicación, pero no al usuario final de la carga de trabajo.
Beneficios de establecer esta práctica recomendada: La experiencia del usuario se ve muy afectada por la latencia entre el usuario y la aplicación. Al utilizar las Regiones de AWS adecuadas y la red global privada de AWS, puede reducir la latencia y ofrecer una mejor experiencia a los usuarios remotos.
Nivel de riesgo expuesto si no se establece esta práctica recomendada: medio
Guía para la implementación
Los recursos, como las instancias de Amazon EC2, se colocan en zonas de disponibilidad dentro de Regiones de AWS
Amazon EC2 ofrece grupos de colocación para la creación de redes. Un grupo de registro es una agrupación lógica de instancias para reducir la latencia. El uso de grupos de colocación con tipos de instancias compatibles y un Elastic Network Adapter (ENA) permite que las cargas de trabajo participen en una red de 25 Gbps de baja latencia y fluctuación reducida. Se recomiendan grupos de colocación para cargas de trabajo que aprovechan la baja latencia de red, el alto rendimiento de red o ambos.
Los servicios sensibles a la latencia se prestan en ubicaciones periféricas mediante una red global de AWS, comoAmazon CloudFront
Utilice los servicios periféricos para reducir la latencia y permitir el almacenamiento en caché del contenido. Configure correctamente el control de caché para DNS y HTTP/HTTPS a fin de obtener el mayor beneficio de estos enfoques.
Pasos para la implementación
-
Recoja información sobre el tráfico IP que entra y sale de las interfaces de red.
-
Analice los patrones de acceso de la red en su carga de trabajo para identificar cómo utilizan los usuarios su aplicación.
-
Utilice herramientas de supervisión, como Amazon CloudWatch
y AWS CloudTrail , para recopilar datos sobre las actividades de red. -
Analice los datos para identificar el patrón de acceso de la red.
-
-
Seleccione regiones para el despliegue de la carga de trabajo en función de los siguientes elementos clave:
-
Dónde se encuentran sus datos: en el caso de las aplicaciones con gran cantidad de datos (como big data y machine learning), el código de la aplicación debe ejecutarse lo más cerca posible de los datos.
-
Dónde se encuentran sus usuarios: en el caso de las aplicaciones orientadas al usuario, elija una región (o varias regiones) cerca de los usuarios de su carga de trabajo.
-
Otras restricciones: tenga en cuenta restricciones como el coste y el cumplimiento, tal y como se explica en What to Consider when Selecting a Region for your Workloads
.
-
-
Utilice zonas locales de AWS
para ejecutar cargas de trabajo como la renderización de vídeo. Las zonas locales le permiten beneficiarse de tener recursos de computación y almacenamiento más cerca de los usuarios finales. -
Utilice AWS Outposts
para cargas de trabajo que deban seguir siendo locales y en las que desee que esa carga de trabajo se ejecute sin problemas con el resto de sus demás cargas de trabajo en AWS. -
Aplicaciones como la transmisión de vídeo en directo de alta resolución, audio de alta fidelidad y realidad aumentada/realidad virtual (RA/RV) requieren una latencia ultrabaja para dispositivos 5G. Para este tipo de aplicaciones, considere AWS Wavelength
. AWS Wavelength integra los servicios de computación y almacenamiento de AWS en las redes 5G, lo que proporciona una infraestructura de computación periférica móvil para desarrollar, desplegar y escalar aplicaciones de latencia ultrabaja. -
Utilice almacenamiento en caché local o soluciones de almacenamiento en caché de AWS
para los recursos de uso frecuente con el fin de mejorar el rendimiento, reducir el movimiento de datos y disminuir el impacto medioambiental. Service When to use Se usa para almacenar en caché el contenido estático como imágenes, scripts y vídeos, así como el contenido dinámico como respuestas de API y aplicaciones web.
Se usa para almacenar en caché el contenido de las aplicaciones web.
Se usa para añadir aceleración en memoria a sus tablas de DynamoDB.
-
Utilice servicios que puedan ayudarle a ejecutar el código más cerca de los usuarios de su carga de trabajo, como estas:
Service When to use Se usa para las operaciones que utilizan muchos recursos de computación que se inician cuando los objetos no están en la memoria caché.
Se usan para casos de uso sencillos como las manipulaciones de solicitudes o respuestas HTTP(s) que pueden iniciarse mediante funciones de corta duración.
Se usa para ejecutar la computación local, la mensajería y el almacenamiento en caché de datos para los dispositivos conectados.
-
Algunas aplicaciones requieren puntos de entrada fijos o un mayor rendimiento mediante el aumento del rendimiento y la reducción de la fluctuación y de la latencia del primer byte. Estas aplicaciones pueden beneficiarse de los servicios de red que proporcionan direcciones IP estáticas de difusión por proximidad y terminación TCP en ubicaciones periféricas. AWS Global Accelerator
puede mejorar el rendimiento de las aplicaciones hasta en un 60 % y proporcionar una rápida conmutación por error para arquitecturas multirregión. AWS Global Accelerator le proporciona direcciones IP estáticas de difusión por proximidad que sirven como punto de entrada fijo para las aplicaciones alojadas en una o más Regiones de AWS. Estas direcciones IP permiten que el tráfico entre en la red global de AWS lo más cerca posible de sus usuarios. AWS Global Accelerator reduce el tiempo de configuración de la conexión inicial al establecer una conexión TCP entre el cliente y la ubicación periférica de AWS más cercana al cliente. Revise el uso de AWS Global Accelerator para mejorar el rendimiento de sus cargas de trabajo TCP/UDP y proporcionar una rápida conmutación por error para arquitecturas multirregión.
Recursos
Prácticas recomendadas relacionadas:
Documentos relacionados:
-
AWS Local Zones and AWS Outposts, choosing the right technology for your edge workload
(AWS Local Zones y AWS Outposts: elegir la tecnología adecuada para su carga de trabajo de periferia)
Vídeos relacionados:
-
AWS Local Zones Explainer Video
(Vídeo explicativo de AWS Local Zones) -
AWS re:Invent 2023 - A migration strategy for edge and on-premises workloads
-
AWS re:Invent 2021 - AWS Outposts: Bringing the AWS experience on premises
(AWS re:Invent 2021: Llevar la experiencia de AWS al entorno local) -
AWS re:Invent 2020: AWS Wavelength: Run apps with ultra-low latency at 5G edge
-
AWS re:Invent 2022 - AWS Local Zones: Building applications for a distributed edge
(AWS re:Invent 2022: AWS Local Zones: creación de aplicaciones para una periferia distribuida) -
AWS re:Invent 2021 - Building low-latency websites with Amazon CloudFront
(AWS re:Invent 2021: Creación de sitios web de baja latencia con Amazon CloudFront) -
AWS re:Invent 2022 - Improve performance and availability with AWS Global Accelerator
(AWS re:Invent 2022: Mejorar el rendimiento y la disponibilidad con AWS Global Accelerator) -
AWS re:Invent 2022 - Build your global wide area network using AWS
(AWS re:Invent 2022: Construya su red mundial de área extensa con AWS) -
AWS re:Invent 2020: Global traffic management with Amazon Route 53
(AWS re:Invent 2020: Administración de tráfico global con Amazon Route 53)
Ejemplos relacionados:
-
Handling Rewrites and Redirects using Edge Functions
(Gestión de reescrituras y redireccionamientos mediante funciones periféricas)