PERF03-BP01 Comprender las características y los requisitos de almacenamiento
Identifique y documente las necesidades de almacenamiento de la carga de trabajo y defina las características de almacenamiento de cada ubicación. Ejemplos de características de almacenamiento: acceso compartible, tamaño de los archivos, tasa de crecimiento, rendimiento, operaciones de entrada/salida por segundo (IOPS), latencia, patrones de acceso y persistencia de los datos. Utilice estas características para evaluar si los servicios de almacenamiento de bloques, archivos, objetos o instancias son la solución más eficiente para sus necesidades de almacenamiento.
Resultado deseado: Identificar y documentar los requisitos de almacenamiento por necesidad y evaluar las soluciones de almacenamiento disponibles. Basándose en las características clave del almacenamiento, su equipo entenderá cómo los servicios de almacenamiento seleccionados beneficiarán el rendimiento de su carga de trabajo. Los criterios clave incluyen los patrones de acceso a los datos, la tasa de crecimiento, las necesidades de escalado y los requisitos de latencia.
Patrones comunes de uso no recomendados:
-
Solo utiliza un tipo de almacenamiento, como por ejemplo Amazon Elastic Block Store (Amazon EBS), para todas las cargas de trabajo.
-
Supone que todas las cargas de trabajo tienen requisitos de rendimiento de acceso al almacenamiento similares.
Beneficios de establecer esta práctica recomendada: La selección de la solución de almacenamiento en función de las características identificadas y requeridas ayudará a mejorar el rendimiento de las cargas de trabajo, a disminuir los costes y a reducir los esfuerzos operativos a la hora de mantener la carga de trabajo. El rendimiento de su carga de trabajo se beneficiará de la solución, la configuración y la ubicación del servicio de almacenamiento.
Nivel de riesgo expuesto si no se establece esta práctica recomendada: Alto
Guía para la implementación
Identifique las métricas de rendimiento de almacenamiento más importantes de su carga de trabajo e implemente mejoras como parte de un enfoque basado en datos, utilizando el análisis comparativo o las pruebas de carga. Utilice estos datos para identificar dónde está limitada su solución de almacenamiento y examine las opciones de configuración para mejorar la solución. Determine la tasa de crecimiento prevista para su carga de trabajo y elija una solución de almacenamiento que satisfaga esas tasas. Investigue las ofertas de almacenamiento de AWS para determinar la solución de almacenamiento correcta para sus diversas necesidades de carga de trabajo. El aprovisionamiento de soluciones de almacenamiento en AWS aumenta la oportunidad de probar las ofertas de almacenamiento y determinar si son adecuadas para sus necesidades de carga de trabajo.
Servicio de AWS | Características clave | Casos de uso habituales |
---|---|---|
Amazon S3 |
99,999999999 % de durabilidad, crecimiento ilimitado, accesible desde cualquier lugar, varios modelos de coste basados en el acceso y resiliencia |
Datos de aplicaciones nativas en la nube, archivo de datos y copias de seguridad, análisis, lagos de datos, alojamiento de sitios web estáticos, datos de IoT |
Amazon S3 Glacier |
Latencia de segundos a horas, crecimiento ilimitado, menor coste, almacenamiento a largo plazo |
Archivado de datos, archivos multimedia, conservación de copias de seguridad a largo plazo. |
Amazon EBS | El tamaño del almacenamiento requiere administración y supervisión, baja latencia, almacenamiento persistente, durabilidad del 99,8 % al 99,9 %, la mayoría de los tipos de volumen son accesibles solo desde una instancia de EC2. |
Aplicaciones COTS, aplicaciones con uso intensivo de E/S, bases de datos relacionales y NoSQL, copias de seguridad y recuperación |
Almacén de instancias de EC2 |
Tamaño de almacenamiento predeterminado, latencia mínima, no persistente, accesible solo desde una instancia de EC2 |
Aplicaciones COTS, aplicaciones intensivas de E/S, almacén de datos en memoria |
Amazon EFS |
99,999999999 % de durabilidad, crecimiento ilimitado, accesible por múltiples servicios de computación |
Aplicaciones modernizadas que comparten archivos en múltiples servicios de computación, almacenamiento de archivos para escalar sistemas de administración de contenidos |
Amazon FSx |
Admite cuatro sistemas de archivos (NetApp, OpenZFS, Windows File Server y Amazon FSx for Lustre), almacenamiento disponible diferente por sistema de archivos, accesible por varios servicios de computación |
Cargas de trabajo nativas de la nube, ampliación en nube privada, cargas de trabajo migradas que requieren un sistema de archivos específico, VMC, sistemas ERP, almacenamiento de archivos y copias de seguridad locales |
Familia Snow |
Dispositivos portátiles, cifrado de 256 bits, punto de conexión NFS, computación incorporada, TBs de almacenamiento |
Migración de datos a la nube, almacenamiento y computación en condiciones locales extremas, recuperación de desastres, recopilación remota de datos |
AWS Storage Gateway |
Proporciona acceso local de baja latencia al almacenamiento respaldado por la nube, caché local completamente administrada |
Migraciones de datos locales a la nube, llenado de lagos de datos en la nube desde orígenes locales, uso compartido de archivos modernizado. |
Pasos para la aplicación:
-
Utilice estudios comparativos o pruebas de carga para recopilar las características clave de sus necesidades de almacenamiento. Entre las características clave se incluyen:
-
Compartible (qué componentes acceden a este almacenamiento)
-
Tasa de crecimiento
-
Rendimiento
-
Latencia
-
Tamaño de E/S
-
Durabilidad
-
Patrones de acceso (lecturas frente a escrituras, frecuencia, con picos o constantes)
-
-
Identifique el tipo de solución de almacenamiento compatible con sus características de almacenamiento.
-
Amazon S3
es un servicio de almacenamiento de objetos con escalabilidad ilimitada, alta disponibilidad y varias opciones de accesibilidad. La transferencia y el acceso a los objetos dentro y fuera de Amazon S3 puede utilizar un servicio como Aceleración de transferencia o bien Puntos de acceso para respaldar su ubicación, necesidades de seguridad y patrones de acceso. Utilice las directrices de rendimiento de Amazon S3 para ayudar a optimizar la configuración de Amazon S3 para satisfacer sus necesidades de rendimiento de la carga de trabajo. -
Amazon S3 Glacier
es una clase de almacenamiento de Amazon S3 desarrollada para el archivado de datos. Puede elegir entre tres soluciones de archivo que van desde el acceso en milisegundos hasta el acceso de 5 a 12 horas con diferentes opciones de coste y seguridad. Amazon S3 Glacier puede ayudarle a cumplir los requisitos de rendimiento mediante la implementación de un ciclo de vida de los datos que se ajuste a los requisitos de su empresa y a las características de los datos. -
Amazon Elastic Block Store (Amazon EBS)
es un servicio de almacenamiento de bloques de alto rendimiento diseñado para Amazon Elastic Compute Cloud (Amazon EC2). Puede elegir entre soluciones basadas en SSD o HDD con diferentes características que priorizan las IOPS o bien el rendimiento,. Los volúmenes de EBS son muy adecuados para las cargas de trabajo de alto rendimiento, el almacenamiento principal para los sistemas de archivos, las bases de datos o las aplicaciones que solo pueden acceder a los sistemas de etapas conectados. -
El almacén de instancias de Amazon EC2 es similar a Amazon EBS ya que se adjunta a una instancia de Amazon EC2; sin embargo, el almacén de instancias es solo un almacenamiento temporal que debería usarse idealmente como búfer, caché u otro contenido temporal. No se puede separar un almacén de instancias, y si la instancia se cierra se pierden todos los datos. Los almacenes de instancias pueden utilizarse para casos de uso de alto rendimiento de E/S y baja latencia en los que no es necesario conservar los datos.
-
Amazon Elastic File System (Amazon EFS)
es un sistema de archivos montable al que pueden acceder varios tipos de soluciones de computación. Amazon EFS aumenta y reduce automáticamente el almacenamiento y su rendimiento se ha optimizado para ofrecer latencias bajas y constantes. EFS tiene dos modos de configuración del rendimiento: uso general y E/S máx. El modo de uso general tiene una latencia de lectura de menos de un milisegundo y una latencia de escritura de un milisegundo de un solo dígito. El modo de E/S máx. puede admitir miles de instancias de cálculo que requieran un sistema de archivos compartido. Amazon EFS admite dos modos de rendimiento: por ráfagas y aprovisionado. Una carga de trabajo que experimenta un patrón de acceso irregular se beneficiará del modo de rendimiento en ráfagas, mientras que una carga de trabajo que es constantemente alta tendría un buen rendimiento con un modo de rendimiento aprovisionado. -
Amazon FSx
se basa en las últimas soluciones de computación de AWS para soportar cuatro sistemas de archivos de uso común: NetApp ONTAP, OpenZFS, Windows File Server y Lustre. Amazon FSx latencia, rendimiento y E/S por segundo varían según el sistema de archivos y deben tenerse en cuenta a la hora de seleccionar el sistema de archivos adecuado para sus necesidades de carga de trabajo. -
AWS Snow Family
son dispositivos de almacenamiento y computación que admiten la migración de datos en línea y fuera de línea a la nube y el almacenamiento y la computación de datos localmente. Los dispositivos de AWS Snow soportan la recopilación de grandes cantidades de datos localmente, el procesamiento de esos datos y su traslado a la nube. Hay varias prácticas recomendadas documentadas sobre rendimiento en lo que respecta al número de archivos, el tamaño de los mismos y la compresión. -
AWS Storage Gateway
proporciona a las aplicaciones locales acceso al almacenamiento ubicado en la nube. AWS Storage Gateway admite varios servicios de almacenamiento en la nube, como Amazon S3, Amazon S3 Glacier, Amazon FSx y Amazon EBS. Admite varios protocolos como iSCSI, SMB y NFS. Proporciona un rendimiento de baja latencia al almacenar en caché los datos a los que se accede con frecuencia localmente y solo envía los datos modificados y los comprimidos a AWS.
-
-
Una vez que haya experimentado con su nueva solución de almacenamiento y haya identificado la configuración óptima, planifique su migración y valide sus métricas de rendimiento. Se trata de un proceso continuo, que debe reevaluarse cuando cambien las características clave o los servicios u opciones disponibles.
Nivel de esfuerzo para el plan de implementación: Si una carga de trabajo se desplaza de una solución de almacenamiento a otra, podría haber un nivel de esfuerzo moderado implicado en la refactorización de la aplicación.
Recursos
Documentos relacionados:
-
Amazon EFS: Amazon EFS Performance (Amazon EFS: rendimiento de Amazon EFS)
-
Amazon FSx for Lustre Performance (Rendimiento de Amazon FSx para Lustre)
-
Amazon FSx for Windows File Server Performance (Rendimiento de Amazon FSx for Windows File Server)
-
Amazon FSx for NetApp ONTAP performance (Rendimiento de Amazon FSx for NetApp ONTAP)
-
Amazon FSx for OpenZFS performance (Rendimiento de Amazon FSx for OpenZFS)
Vídeos relacionados:
Ejemplos relacionados: