SUS04-BP06 Usar sistemas de archivos o almacenamiento compartidos para acceder a datos comunes
Adopte sistemas de archivos o almacenamiento compartidos para evitar la duplicación de datos y posibilitar una infraestructura más eficiente para su carga de trabajo.
Antipatrones usuales:
-
Aprovisiona almacenamiento para cada cliente.
-
No desconecta el volumen de datos de los clientes inactivos.
-
No proporciona acceso al almacenamiento a través de plataformas y sistemas.
Beneficios de establecer esta práctica recomendada: el uso de sistemas de archivos o almacenamiento compartidos permite compartir los datos con uno o varios consumidores sin tener que copiarlos. De este modo, se reducen los recursos de almacenamiento necesarios para la carga de trabajo.
Nivel de riesgo expuesto si no se establece esta práctica recomendada: medio
Guía para la implementación
Si tiene varios usuarios o aplicaciones que acceden a los mismos conjuntos de datos, el uso de la tecnología de almacenamiento compartido es esencial para utilizar una infraestructura eficiente para su carga de trabajo. La tecnología de almacenamiento compartido proporciona una ubicación central para almacenar y administrar conjuntos de datos y evitar la duplicación de datos. También refuerza la coherencia de los datos entre los distintos sistemas. Además, la tecnología de almacenamiento compartido permite un uso más eficaz de la potencia de computación, ya que varios recursos de computación pueden acceder a los datos y procesarlos simultáneamente en paralelo.
Obtenga datos de estos servicios de almacenamiento compartido solo cuando los necesite y desconecte los volúmenes que no utilice para liberar recursos.
Pasos para la implementación
-
Migre los datos al almacenamiento compartido cuando tengan varios consumidores. A continuación le mostramos algunos ejemplos de tecnología de almacenamiento compartido en AWS:
Storage option When to use Amazon EBS Multi-Attach le permite asociar un único volumen SSD de E/S por segundo aprovisionadas (io1 o io2) a varias instancias que se encuentren en la misma zona de disponibilidad.
Consulte When to Choose Amazon EFS
(Cuándo elegir Amazon EFS). Consulte Choosing an Amazon FSx File System
(Elección de un sistema de archivos de Amazon FSx). Las aplicaciones que no requieren una estructura de sistema de archivos y están diseñadas para colaborar con el almacenamiento de objetos pueden utilizar Amazon S3 como una solución de almacenamiento de objetos escalable de forma masiva, duradera y de bajo coste.
-
Copie datos en sistemas de archivos compartidos, o recupérelos de ellos, solo cuando sea necesario. Por ejemplo, puede crear un sistema de archivos de Amazon FSx for Lustre respaldado por Amazon S3
y cargar solo el subconjunto de datos necesarios para procesar los trabajos en Amazon FSx. -
Elimine los datos según corresponda a sus patrones de uso, como se indica en SUS04-BP03 Usar políticas para administrar el ciclo de vida de los conjuntos de datos.
-
Desconecte los volúmenes de los clientes que no los estén usando de forma activa.
Recursos
Documentos relacionados:
-
Linking your file system to an Amazon S3 bucket (Vinculación del sistema de archivos a un bucket de Amazon S3)
-
Using Amazon EFS for AWS Lambda in your serverless applications
(Uso de Amazon EFS para AWS Lambda en las aplicaciones sin servidor) -
Amazon EFS Intelligent-Tiering Optimizes Costs for Workloads with Changing Access Patterns
(Amazon EFS Intelligent-Tiering optimiza los costes para las cargas de trabajo con patrones de acceso cambiantes) -
Using Amazon FSx with your on-premises data repository (Uso de Amazon FSx con su repositorio de datos local)
Vídeos relacionados:
-
Storage cost optimization with Amazon EFS
(Optimización de costes de almacenamiento con Amazon EFS) -
«AWS re:Invent 2023 - File storage for builders and data scientists on Amazon Elastic File System»