¿Qué es Amazon FSx para Lustre? - FSx para Lustre

Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.

¿Qué es Amazon FSx para Lustre?

FSx para Lustre hace que sea fácil y rentable lanzar y ejecutar el popular sistema de archivos Lustre de alto rendimiento. Utiliza Lustre para cargas de trabajo en las que la velocidad es importante, como el machine learning, la computación de alto rendimiento (HPC), el procesamiento de vídeo y el modelado financiero.

El sistema de archivos Lustre de código abierto está diseñado para aplicaciones que requieren un almacenamiento rápido, en las que desea que el almacenamiento esté a la altura del procesamiento. Lustre se creó para resolver el problema de procesar de forma rápida y económica los crecientes conjuntos de datos del mundo. Es un sistema de archivos muy utilizado diseñado para los ordenadores más rápidos del mundo. Proporciona latencias inferiores a un milisegundo, hasta cientos de GBps de rendimiento y hasta millones de IOPS. Para obtener más información, consulte el sitio web de Lustre.

Como servicio totalmente gestionado, Amazon FSx facilita el uso de Lustre para cargas de trabajo en las que la velocidad de almacenamiento es importante. FSx para Lustre elimina la complejidad tradicional de configurar y administrar los sistemas de archivos Lustre, lo que le permite poner en marcha y ejecutar un sistema de archivos de alto rendimiento probado en cuestión de minutos. También ofrece múltiples opciones de implementación para que pueda optimizar los costes en función de las necesidades.

FSx para Lustre es compatible con POSIX, por lo que puede utilizar las aplicaciones actuales basadas en Linux sin tener que realizar ningún cambio. FSx para Lustre proporciona una interfaz de sistema de archivos nativa y funciona como cualquier sistema de archivos con el sistema operativo Linux. También proporciona read-after-write coherencia y admite el bloqueo de archivos.

Múltiples opciones de implementación

Amazon FSx para Lustre ofrece una selección de sistemas de archivos temporales y persistentes para adaptarse a las diferentes necesidades de procesamiento de datos. Los sistemas de archivos temporales son ideales para el almacenamiento temporal y el procesamiento de datos de corto plazo. Los datos no se replican y no persisten si un servidor de archivos falla. Los sistemas de archivos persistentes son ideales para el almacenamiento de largo plazo y las cargas de trabajo centradas en el rendimiento. En los sistemas de archivos persistentes, los datos se replican y los servidores de archivos se sustituyen si fallan. Para obtener más información, consulte Opciones de implementación para sistemas de archivos de FSx para Lustre.

Múltiples opciones de almacenamiento

Amazon FSx para Lustre ofrece una selección de tipos de almacenamiento en unidades de estado sólido (SSD) y unidades de disco duro (HDD) optimizados para diferentes requisitos de procesamiento de datos:

  • Opciones de almacenamiento en SSD: para cargas de trabajo de baja latencia e intensivas en IOPS que suelen tener operaciones de archivos pequeñas y aleatorias, elija una de las opciones de almacenamiento en SSD.

  • Opciones de almacenamiento en disco duro: para cargas de trabajo con un rendimiento intensivo que suelen tener operaciones de archivos secuenciales de gran tamaño, elija una de las opciones de almacenamiento en disco duro.

Si aprovisiona un sistema de archivos con la opción de almacenamiento en disco duro, también puede aprovisionar una caché SSD de solo lectura con un tamaño del 20 por ciento de la capacidad de almacenamiento de su disco duro. Esto proporciona latencias inferiores a un milisegundo e IOPS más altas para los archivos a los que se accede con frecuencia. Tanto los sistemas de archivos basados en SSD como los basados en HDD se aprovisionan con servidores de metadatos basados en SSD. Como resultado, todas las operaciones de metadatos, que representan la mayoría de las operaciones del sistema de archivos, se entregan con latencias inferiores a un milisegundo.

Para obtener más información sobre el rendimiento de estas opciones de almacenamiento, consulte Rendimiento de Amazon FSx para Lustre.

FSx para Lustre y repositorios de datos

Puede vincular los sistemas de archivos de FSx para Lustre a los repositorios de datos de Amazon S3 o en las instalaciones de datos locales.

Integración con el repositorio de datos FSx para Lustre S3

FSx para Lustre se integra con Amazon S3, lo que le facilita el procesamiento de conjuntos de datos en la nube mediante el sistema de archivos de alto rendimiento Lustre. Cuando se encuentra vinculado a un bucket de Amazon S3, un sistema de archivos de FSx para Lustre presenta de forma transparente los objetos de S3 como archivos. Amazon FSx importa listados de todos los archivos existentes en el bucket de S3 al crear el sistema de archivos. Amazon FSx también puede importar listados de archivos añadidos al repositorio de datos una vez creado el sistema de archivos. Puede configurar las preferencias de importación para que se ajusten a las necesidades de su flujo de trabajo. El sistema de archivos también le permite volver a escribir los datos del sistema de archivos en S3. Las tareas de repositorio de datos simplifican la transferencia de datos y metadatos entre el sistema de archivos de FSx para Lustre y su repositorio de datos duradero en Amazon S3. Para obtener más información, consulte Uso de repositorios de datos con Amazon FSx para Lustre y Tareas de repositorio de datos.

FSx para Lustre y repositorios datos en las instalaciones locales

Con Amazon FSx for Lustre, puede dividir sus cargas de trabajo de procesamiento de datos del entorno local Nube de AWS en el entorno local importando datos mediante o. AWS Direct Connect AWS VPN Para obtener más información, consulte Uso de Amazon FSx con sus datos en las instalaciones.

Acceso a sistemas de archivos de FSx para Lustre

Puede mezclar y combinar los tipos de instancia de procesamiento y la Imagen de máquina de Amazon (AMI) de Linux que están conectadas a un único sistema de archivos de FSx para Lustre.

Se puede acceder a los sistemas de archivos de Amazon FSx para Lustre desde cargas de trabajo de procesamiento que se ejecutan en instancias Amazon Elastic Compute Cloud (Amazon EC2), en contenedores Docker de Amazon Elastic Container Service (Amazon ECS) y contenedores que se ejecutan en Amazon Elastic Kubernetes Service (Amazon EKS).

  • Amazon EC2: accede a su sistema de archivos desde sus instancias de procesamiento de Amazon EC2 mediante el cliente Lustre de código abierto. Las instancias de Amazon EC2 pueden acceder a su sistema de archivos desde otras zonas de disponibilidad dentro de la misma Amazon Virtual Private Cloud (Amazon VPC), siempre y cuando la configuración de red permita el acceso a través de subredes dentro de la VPC. Una vez montado el sistema de archivos Amazon FSx para Lustre, puede trabajar con los archivos y directorios como haría con cualquier sistema de archivos local.

  • Amazon EKS: puede acceder a Amazon FSx para Lustre desde contenedores que se ejecutan en Amazon EKS mediante el controlador CSI FSx para Lustre de código abierto, tal y como se describe en la Guía del usuario de Amazon EKS. Los contenedores que se ejecutan en Amazon EKS pueden utilizar volúmenes persistentes (PV) de alto rendimiento respaldados por Amazon FSx para Lustre.

  • Amazon ECS: puede acceder a Amazon FSx para Lustre desde contenedores Docker de Amazon ECS en instancias de Amazon EC2. Para obtener más información, consulte Montaje de Amazon Elastic Container Service.

Amazon FSx para Lustre es compatible con las AMI basadas en Linux más populares, incluidas Amazon Linux 2 y Amazon Linux, Red Hat Enterprise Linux (RHEL), CentOS, Ubuntu y SUSE Linux. El cliente Lustre se incluye en Amazon Linux 2 y Amazon Linux. Para RHEL, Centos y Ubuntu, AWS un repositorio de clientes de Lustre proporciona clientes que son compatibles con estos sistemas operativos.

Con FSx for Lustre, puede distribuir sus cargas de trabajo con un uso intensivo de cómputo desde las instalaciones locales Nube de AWS al importando datos a través de o. AWS Direct Connect AWS Virtual Private Network Puede acceder a su sistema de archivos Amazon FSx en las instalaciones, copiar los datos en su sistema de archivos según sea necesario y ejecutar cargas de trabajo de procesamiento de datos intensivo en instancias en la nube.

Para obtener más información sobre los clientes, las instancias de procesamiento y los entornos desde los que puede acceder a los sistemas de archivos de FSx para Lustre, consulte Acceso a sistemas de archivo.

AWS Integraciones con servicios

Amazon FSx for Lustre se integra con SageMaker Amazon como fuente de datos de entrada. Cuando se utiliza SageMaker con FSx for Lustre, sus trabajos de formación en aprendizaje automático se aceleran al eliminar el paso inicial de descarga de Amazon S3. Además, el costo total de propiedad (TCO) se reduce al evitar la descarga repetitiva de objetos comunes para trabajos iterativos en el mismo conjunto de datos, lo que ahorra en costos de solicitudes de S3. Para obtener más información, consulte ¿Qué es? SageMaker en la Guía para SageMaker desarrolladores de Amazon. Para ver un tutorial sobre cómo utilizar Amazon FSx for Lustre como fuente de datos, consulte Acelere la formación en Amazon SageMaker con Amazon FSx SageMaker for Lustre y los sistemas de archivos Amazon EFS en el blog Machine Learning.AWS

FSx for Lustre se AWS Batch integra con el uso de plantillas de lanzamiento de EC2. AWS Batch le permite ejecutar cargas de trabajo informáticas por lotes en el entorno Nube de AWS, incluidas las de computación de alto rendimiento (HPC), aprendizaje automático (ML) y otras cargas de trabajo asíncronas. AWS Batch dimensiona las instancias de forma automática y dinámica en función de los requisitos de recursos del trabajo. Para obtener más información, consulte ¿Qué es AWS Batch? en la Guía AWS Batch del usuario.

FSx for AWS ParallelCluster Lustre se integra con. AWS ParallelCluster es una herramienta de gestión AWS de clústeres de código abierto compatible que se utiliza para implementar y gestionar clústeres de HPC. Puede crear automáticamente los sistemas de archivos de FSx para Lustre o utilizar los sistemas de archivos existentes durante el proceso de creación del clúster.

Seguridad y conformidad

Los sistemas de archivos de FSx para Lustre admiten el cifrado en reposo y en tránsito. Amazon FSx cifra automáticamente los datos del sistema de archivos en reposo mediante claves administradas en AWS Key Management Service ().AWS KMS Los datos en tránsito también se cifran automáticamente en algunos sistemas de archivos Regiones de AWS cuando se accede a ellos desde instancias Amazon EC2 compatibles. Para obtener más información sobre el cifrado de datos en FSx for Lustre Regiones de AWS , incluidos los casos en los que se admite el cifrado de datos en tránsito, consulte. Cifrado de datos en Amazon FSx para Lustre Se ha evaluado que Amazon FSx cumple con las certificaciones ISO, PCI-DSS y SOC, y cumple con los requisitos de la HIPAA. Para obtener más información, consulte Seguridad en FSx para Lustre.

Suposición

En esta guía, hacemos las siguientes suposiciones:

  • Si utiliza Amazon Elastic Compute Cloud (Amazon EC2), suponemos que está familiarizado con ese servicio. Para obtener más información sobre cómo utilizar Amazon EC2, consulte la Documentación de Amazon EC2.

  • Suponemos que está familiarizado con el uso de Amazon Virtual Private Cloud (Amazon VPC). Para obtener más información sobre cómo utilizar Amazon VPC, consulte la Guía del usuario de Amazon VPC.

  • Suponemos que no ha cambiado las reglas del grupo de seguridad predeterminado de su VPC en función del servicio Amazon VPC. Si lo ha hecho, asegúrese de añadir las reglas necesarias para permitir el tráfico de red desde la instancia de Amazon EC2 al sistema de archivos de Amazon FSx para Lustre. Para obtener más información, consulte Control de acceso al sistema de archivos con Amazon VPC.

Precios de Amazon FSx para Lustre

Con Amazon FSx para Lustre, no hay costes iniciales de hardware o software. Solo paga por los recursos utilizados, sin compromisos mínimos, costos de configuración ni tarifas adicionales. Para obtener información sobre los precios y tarifas asociados al servicio, consulte Precios de Amazon FSx para Lustre.

Amazon FSx para Lustre

Si tiene problemas al utilizar Amazon FSx para Lustre, consulte los foros.

¿Es la primera vez que usa Amazon FSx para Lustre?

Si es la primera vez que utiliza Amazon FSx para Lustre, le recomendamos que lea las siguientes secciones en orden:

  1. Si está preparado para crear su primer sistema de archivos Amazon FSx para Lustre, inténtelo Introducción a Amazon FSx para Lustre.

  2. Para obtener más información sobre el desempeño, consulte Rendimiento de Amazon FSx para Lustre.

  3. Para obtener información sobre cómo vincular su sistema de archivos a un repositorio de datos de bucket de Amazon S3, consulte Uso de repositorios de datos con Amazon FSx para Lustre.

  4. Para ver los detalles de seguridad de Amazon FSx para Lustre, consulte Seguridad en FSx para Lustre.

  5. Para obtener información sobre los límites de escalabilidad de Amazon FSx para Lustre, incluidos el rendimiento y el tamaño del sistema de archivos, consulte Cuotas.

  6. Para obtener información sobre la API de Amazon FSx para Lustre, consulte la referencia de la API de Amazon FSx para Lustre.