Considérations relatives à SAS sur AWS - AWS Conseils prescriptifs

Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.

Considérations relatives à SAS sur AWS

Contexte SAS

  • Espace de fichiers de données permanent SAS (SASDATA)

    • Stocke les données persistantes pour l'exploitation SAS et les fichiers de sortie SAS qui en résultent

    • Lecture approfondie d'extraits, mais moins abondamment réécrite

  • Espace de fichiers de données de travail SAS (SASWORK)

    • Espace de travail Scratch pour les tâches SAS

    • Utilisé pour effectuer l'activité de stockage fonctionnelle des procédures SAS à thread unique

  • Espace de fichiers de données SAS Utility (UTILLOC)

    • Même type d'espace que SASWORK pour les procédures SAS multithread

    • Par défaut, placé en tant que sous-répertoire sous SASWORK

  • Le stockage ne persiste pas en cas de redémarrage ou de redémarrage de périphériques SSD internes regroupés dans une configuration RAID 0. Nous vous recommandons d'utiliser des instances dotées de périphériques éphémères non volatils memory express (NVMe) dotés d'une bande passante élevée, d'une faible latence et d'E/S séquentielles. Ces instances sont idéales pour les données SAS temporaires (SASWORK et UTILLOC).

Système de fichiers partagé SAS (requis pour SAS Grid)

  • AWS configure les systèmes de fichiers Lustre avec les options rwseclabel,, et lazystatfs mount. Ces options de montage ne sont pas recommandées pour SAS Grid. Vous devrez donc les démonter FSx pour les systèmes de fichiers Lustre et les remonter avec le flock paramètre.

  • Vous ne pouvez pas augmenter la taille de votre système de fichiers Lustre. Pour redimensionner, créez un système de fichiers Lustre plus grand et copiez les données de l'ancien système vers le nouveau.

  • FSx Pour les systèmes de fichiers persistants Lustre, les données sont répliquées au sein d'une seule zone de disponibilité pour une durabilité accrue. Il n'est pas répliqué entre les zones de AWS disponibilité.

  • Nous vous recommandons d'utiliser l'option de stockage Amazon S3 pour SAS Grid et FSx Lustre. Pour plus d'informations, consultez la section Utilisation de référentiels de données avec FSx for Lustre dans la AWS documentation.

  • Consultez le tableau des AWS régions pour connaître la disponibilité des services dans AWS les régions et les zones de disponibilité. Consultez également la réplication entre régions (SRR) ou la réplication entre régions (CRR) d'Amazon S3 pour connaître les implications des besoins de réplication des données en termes de haute disponibilité.

Types d'instances de niveau serveur SAS Grid

Les serveurs SAS Grid ont besoin de rapidité CPUs pour traiter les données. Nous recommandons :

  • Un minimum de 8 Go de RAM physique par cœur physique et un débit d'E/S robuste (en particulier pour SASWORK et SAS UTILLOC).

  • Instances I3 : les instances Amazon EC2 I3 sont optimisées en termes de stockage pour les charges de travail impliquant des transactions élevées et une faible latence. Ces instances incluent des instances NVMe SSD optimisées pour le stockage pour des performances d'E/S aléatoires élevées, un débit de lecture séquentiel élevé et des IOPS élevées. En raison de la bande passante d'E/S interne élevée des disques NVMe SSD répartis par bandes pour SASWORK et SAS UTILLOC, vous devez configurer votre environnement de manière à utiliser explicitement les disques locaux SSD NVMe basés sur des disques SSD au lieu des volumes Amazon EBS.

  • Instances i3EN : cette famille fournit des instances NVMe SSD optimisées pour le stockage sur EC2 Amazon avec une mise en réseau améliorée via ENA pour atteindre jusqu'à 100 Gbit/s de bande passante réseau.

  • Instances M5n : la famille M5 offre un équilibre entre le calcul, la mémoire et le réseau. Les instances M5n sont idéales pour les applications qui nécessitent des performances de débit réseau et de débit de paquets améliorées.

  • Les charges de travail SAS peuvent être caractérisées principalement par de grandes demandes d'E/S séquentielles impliquant de gros volumes de données. Nous vous recommandons de prédéterminer vos habitudes d'utilisation du SAS. Cela orientera l'architecture et la configuration optimales des différents systèmes de fichiers sous-jacents et leur approvisionnement en E/S physiques respectifs.

    • Les requêtes, les rapports et les tâches statistiques légères fonctionnent généralement bien avec un taux d'E/S de 100 MiB par seconde par cœur de processeur physique.

    • Les analyses avancées et les tâches statistiques lourdes peuvent nécessiter jusqu'à 150 MiB par seconde par cœur de processeur physique.

    • Dans l'ensemble, nous recommandons un débit d'E/S minimum de 100 à 125 MiB par seconde par cœur de processeur physique.

Types d'instances de niveau intermédiaire et de niveau serveur de métadonnées SAS Grid

Ces serveurs ne nécessitent pas de ressources informatiques intensives ni un débit d'E/S robuste. Ils ont besoin d'accéder à plus de mémoire que les niveaux de calcul SAS. Nous recommandons :

  • Au moins 24 Go de RAM physique ou 8 Go de RAM physique par cœur physique, selon la valeur la plus élevée.

  • Instances R5 ou R5d : ces instances conviennent aux applications gourmandes en mémoire telles que les caches en mémoire, les bases de données en mémoire de taille moyenne et les analyses de mégadonnées en temps réel.

Haute disponibilité et reprise après sinistre pour SAS Grid

La planification de la reprise après sinistre est importante pour tout système métier critique, y compris les systèmes de production qui exécutent la plateforme SAS Intelligence Platform et les solutions SAS.

La reprise après sinistre n'est pas synonyme de haute disponibilité. Bien que les deux concepts soient liés à la continuité des activités, la haute disponibilité consiste à garantir une continuité des opérations ininterrompue. En revanche, la reprise après sinistre implique un certain temps d'arrêt, généralement mesuré en heures ou en jours.