Consideraciones sobre SAS en AWS - AWS Guía prescriptiva

Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.

Consideraciones sobre SAS en AWS

Información general de SAS

  • Espacio de archivos de datos permanentes de SAS (SASDATA)

    • Almacena datos persistentes para su explotación por SAS y los archivos de salida de SAS resultantes

    • De lectura exhaustiva, pero de reescritura menos exhaustiva

  • Espacio de archivos de datos de trabajo SAS (SASWORK)

    • Espacio de trabajo temporal para trabajos de SAS

    • Se utiliza para realizar la actividad de almacenamiento de trabajo de los procedimientos de SAS de un solo subproceso

  • Espacio de archivos de datos de utilidades de SAS (UTILLOC)

    • Mismo tipo de espacio que SASWORK para procedimientos de SAS de subprocesos múltiples

    • De forma predeterminada, dispuesto como un subdirectorio en SASWORK

  • El almacenamiento no persiste cuando se reinician dispositivos internos de estado sólido (SSD) que están agrupados en una configuración RAID 0. Se recomienda utilizar instancias con dispositivos efímeros express (NVMe) de memoria no volátil con gran ancho de banda, baja latencia y E/S secuencial. Estas instancias son ideales para datos SAS temporales (SASWORK y UTILLOC).

Sistema de archivos compartidos SAS (necesario para SAS Grid)

  • AWS configura los sistemas de archivos Lustre con las opciones de montaje y, rw seclabel lazystatfs Estas no son las opciones de montaje recomendadas para SAS Grid, por lo que tendrá que desmontarlas FSx para los sistemas de archivos Lustre y volver a montarlas con el parámetro. flock

  • No puede ampliar el tamaño de su sistema de archivos Lustre. Para cambiar el tamaño, cree un sistema de archivos Lustre más grande y copie los datos del sistema anterior al nuevo.

  • En el FSx caso de los sistemas de archivos persistentes Lustre, los datos se replican en una única zona de disponibilidad para aumentar la durabilidad. No se replican en todas las zonas de disponibilidad de AWS .

  • Le recomendamos que utilice la opción de almacenamiento Amazon S3 para utilizarla con SAS Grid y FSx Lustre. Para obtener más información, consulte Uso de repositorios de datos con FSx for Lustre en la documentación. AWS

  • Consulte la tabla de AWS regiones para ver la disponibilidad de los servicios en todas AWS las regiones y zonas de disponibilidad. Consulte también Replicación en la misma región (SRR) o replicación entre regiones (CRR) de Amazon S3 para conocer las implicaciones de las necesidades de replicación de datos para una alta disponibilidad.

Tipos de instancias de nivel de servidor SAS Grid

Los servidores SAS Grid necesitan un procesamiento rápido CPUs de los datos. Recomendamos:

  • Un mínimo de 8 GB de RAM física por núcleo físico y un rendimiento de E/S sólido (especialmente para SASWORK y SAS UTILLOC).

  • Instancias I3: las instancias EC2 I3 de Amazon están optimizadas para el almacenamiento para cargas de trabajo de baja latencia y alta cantidad de transacciones. Estas instancias incluyen instancias NVMe basadas en SSD que están optimizadas para el almacenamiento y ofrecen un alto rendimiento de E/S aleatorias, un alto rendimiento de lectura secuencial y un alto nivel de IOPS. Debido al alto ancho de banda de E/S interno de las unidades NVMe SSD seccionadas para SASWORK y SAS UTILLOC, debe configurar su entorno para utilizar de forma explícita las unidades locales SSD NVMe basadas en lugar de los volúmenes de Amazon EBS.

  • Instancias i3EN: esta familia proporciona instancias NVMe SSD optimizadas para el almacenamiento en EC2 Amazon con redes mejoradas a través de ENA para lograr un ancho de banda de red de hasta 100 Gbps.

  • Instancias M5n: la familia M5 proporciona un equilibrio entre cómputo, memoria y redes. Las instancias M5n son ideales para aplicaciones que requieren un mejor rendimiento de la red y de la velocidad de paquetes.

  • Las cargas de trabajo SAS se pueden caracterizar como solicitudes de E/S secuenciales predominantemente grandes con grandes volúmenes de datos. Le recomendamos que predetermine sus patrones de uso de SAS. Esto guiará la arquitectura y la configuración óptimas de los sistemas de archivos subyacentes individuales y su respectivo aprovisionamiento de E/S físicas.

    • Los trabajos de consulta, elaboración de informes y estadísticas ligeras suelen funcionar bien con una velocidad de E/S de 100 MiB por segundo por núcleo físico de CPU.

    • Los análisis avanzados y los trabajos estadísticos pesados pueden requerir hasta 150 MiB por segundo por núcleo físico de CPU.

    • En general, recomendamos una tasa de rendimiento de E/S mínima de 100 a 125 MiB por segundo por núcleo físico de CPU.

Tipos de instancias de nivel intermedio y de nivel de servidor de matadatos de SAS Grid

Estos servidores no requieren recursos de cómputo intensivo ni un rendimiento de E/S sólido. Requieren acceso a más memoria que los niveles de computación de SAS. Recomendamos:

  • Un mínimo de 24 GB de RAM física u 8 GB de RAM física por núcleo físico, lo que sea mayor.

  • Instancias R5 o R5d estas instancias son adecuadas para aplicaciones de uso intensivo de memoria, como las cachés en memoria, las bases de datos en memoria de tamaño mediano y el análisis de macrodatos en tiempo real.

Alta disponibilidad y recuperación de desastres para SAS Grid

La planificación de la recuperación de desastres es importante para cualquier sistema empresarial crítico, incluidos los sistemas de producción que utilizan la SAS Intelligence Platform y las soluciones SAS.

Recuperación de desastres no es lo mismo que alta disponibilidad. Si bien ambos conceptos están relacionados con la continuidad del negocio, la alta disponibilidad consiste en proporcionar una continuidad ininterrumpida de las operaciones. En cambio, la recuperación de desastres implica cierto tiempo de inactividad, que normalmente se mide en horas o días.