Considérations relatives à SAS surAWS - AWS Conseils prescriptifs

Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.

Considérations relatives à SAS surAWS

Background SAS

  • Espace de fichiers de données permanent SAS (SASDATA)

    • Stocke les données persistantes pour l'exploitation SAS et les fichiers de sortie SAS

    • Largement lu à partir de, mais moins abondamment écrit

  • Espace de fichiers de données de travail SAS (SASWORK)

    • Espace de travail à gratter pour les tâches SAS

    • Utilisé pour effectuer l'activité de stockage de fonctionnement des procédures SAS monothreads

  • Espace de fichiers de données de l'utilitaire SAS (UTILLOC)

    • Même type d'espace que SASWORK pour les procédures SAS multithread

    • Par défaut, placé comme sous-répertoire sous SASWORK

  • Le stockage ne persiste pas lors d'un redémarrage ou d'un redémarrage de périphériques SSD internes répartis dans une configuration RAID 0. Nous vous recommandons d'utiliser des instances avec des périphériques éphémères NVMe (NVMe) avec une bande passante élevée, une faible latence et des E/S séquentielles. Ces instances sont idéales pour les données SAS temporaires (SASWORK et UTILLOC).

Système de fichiers partagés SAS (requis pour SAS Grid)

  • AWSconfigure les systèmes de fichiers Lustre avec lerw,seclabel, etlazystatfsDes options de montage. Il ne s'agit pas des options de montage recommandées pour SAS Grid. Vous devrez donc démonter ces systèmes de fichiers FSx for Lustre et les remonter avec leflock  Paramètre .

  • Vous ne pouvez pas étendre la taille de votre système de fichiers Lustre. Pour redimensionner, créez un système de fichiers Lustre plus grand et copiez les données de l'ancien système vers le nouveau.

  • Pour les systèmes de fichiers persistants FSx for Lustre, les données sont répliquées dans une seule zone de disponibilité pour une durabilité accrue. Il n'est pas répliqué surAWSZones de disponibilité.

  • Nous vous recommandons d'utiliser l'option de stockage Amazon S3 pour une utilisation avec SAS Grid et FSx for Lustre. Pour de plus amples informations, veuillez consulterUtilisation de référentiels de données avec FSx for Lustredans leAWS.

  • ConsultezAWSTable des régionspour connaître la disponibilité des services surAWSRégions et zones de disponibilité. Vérifiez égalementRéplication de même région (SRR) ou réplication entre régions (CRR) Amazon S3pour les implications des besoins de réplication des données pour une haute disponibilité.

Types d'instances de niveau serveur SAS Grid

Les serveurs SAS Grid ont besoin de processeurs rapides pour le traitement des données. Nous vous recommandons :

  • Un minimum de 8 Go de RAM physique par cœur physique et un débit d'E/S robuste (en particulier pour SASWORK et SAS UTILLOC).

  • Instances I3— Les instances Amazon EC2 I3 sont optimisées pour le stockage pour les charges de travail de transactions élevées et à faible latence. Ces instances comprennent des instances SSD NVMe optimisées pour le stockage pour des performances d'E/S aléatoires élevées, un débit en lecture séquentiel élevé et des IOPS élevées. En raison de la bande passante E/S interne élevée des disques SSD NVMe par bandes pour SASWORK et SAS UTILLOC, vous devez configurer votre environnement pour utiliser explicitement les disques locaux SSD basés sur NVME au lieu des volumes Amazon EBS.

  • Instances I3en— Cette famille fournit des instances SSD NVMe optimisées pour le stockage sur Amazon EC2 avec une mise en réseau améliorée via ENA pour atteindre 100 Gbit/s de bande passante réseau.

  • Instances M5n— La famille M5 offre un équilibre entre le calcul, la mémoire et la mise en réseau. Les instances M5n sont idéales pour les applications nécessitant des performances de débit réseau et de débit de paquets améliorées.

  • Les charges de travail SAS peuvent être caractérisées comme des demandes d'E/S séquentielles principalement volumineuses avec des volumes de données élevés. Nous vous recommandons de prédéterminer vos habitudes d'utilisation SAS. Cela guidera l'architecture et la configuration optimales des systèmes de fichiers sous-jacents individuels et de leur provisionnement d'E/S physiques respectifs.

    • Les tâches de requête, de reporting et de statistiques légères fonctionnent généralement correctement avec un débit d'E/S de 100 MiB par seconde par cœur de processeur physique.

    • Les analyses avancées et les tâches statistiques lourdes peuvent nécessiter jusqu'à 150 MiB par seconde par cœur de processeur physique.

    • Dans l'ensemble, nous recommandons un débit d'E/S minimum de 100 à 125 MiB par seconde par cœur de processeur physique.

Types d'instances de niveau intermédiaire et serveur de métadonnées SAS Grid

Ces serveurs ne nécessitent pas de ressources informatiques gourmandes ni de débit d'E/S robuste. Ils nécessitent un accès à plus de mémoire que les niveaux informatiques SAS. Nous vous recommandons :

  • Un minimum de 24 Go de RAM physique ou 8 Go de RAM physique par cœur physique, selon la valeur la plus élevée.

  • Instances R5 ou R5d— Ces instances conviennent aux applications gourmandes en mémoire telles que les caches en mémoire, les bases de données en mémoire de taille moyenne et les analyses Big Data en temps réel.

Haute disponibilité et reprise après sinistre pour SAS Grid

La planification de la reprise après sinistre est importante pour tout système métier critique, y compris les systèmes de production exécutant la plate-forme SAS Intelligence Platform et les solutions SAS.

La reprise après sinistre n'est pas la même que la haute disponibilité. Bien que les deux concepts soient liés à la continuité de l'activité, la haute disponibilité consiste à fournir une continuité des opérations sans interruption. En revanche, la reprise après sinistre implique un certain nombre de temps d'arrêt, généralement mesurés en heures ou en jours.