Utilisez des systèmes de fichiers partagés ou un stockage objet pour accéder aux données communes et minimiser les ressources réseau totales requises pour prendre en charge le déplacement des données de votre charge de travail.
Anti-modèles courants :
-
Vous stockez toutes les données dans la même Région AWS, indépendamment de l’endroit où se trouvent les utilisateurs des données.
-
Vous n’optimisez ni la taille ni le format des données avant de les déplacer sur le réseau.
Avantages liés au respect de cette bonne pratique : l’optimisation du déplacement des données sur le réseau réduit les ressources réseau totales nécessaires à la charge de travail et diminue son impact environnemental.
Niveau de risque encouru si cette bonne pratique n’est pas respectée : moyen
Directives d’implémentation
Le déplacement des données dans votre entreprise nécessite des ressources de calcul, de réseau et de stockage. Utilisez des techniques pour minimiser les déplacements de données et améliorer l’efficacité globale de votre charge de travail.
Étapes d’implémentation
-
Utiliser la proximité : tenez compte de la proximité des données ou des utilisateurs comme facteur de décision lors de la sélection d’une région pour votre charge de travail
. -
Partitionner les services : partitionnez les services consommés par région afin que les données spécifiques à une région soient stockées dans la région où elles sont consommées.
-
Utiliser des formats de fichiers efficaces : utilisez des formats de fichiers efficaces (tels que Parquet ou ORC) et compressez les données avant de les déplacer sur le réseau.
-
Minimiser le mouvement des données : ne déplacez pas les données inutilisées. Voici quelques exemples qui peuvent vous aider à éviter de déplacer des données inutilisées :
-
Réduisez les réponses de l’API aux seules données pertinentes.
-
Agrégez les données lorsqu’elles sont détaillées (les informations au niveau de l’enregistrement ne sont pas requises).
-
Reportez-vous à Atelier Well-Architected : optimiser le modèle de données à l’aide du partage de données Amazon Redshift
. -
Envisagez le partage de données entre comptes dans AWS Lake Formation.
-
-
Utilisez des services de périphérie : utilisez des services qui peuvent vous aider à exécuter du code au plus près des utilisateurs de votre charge de travail.
Service Utilisation Utilisez ce service pour les opérations exigeantes en puissance de calcul qui sont exécutées lorsque des objets ne sont pas dans le cache.
Utilisez ce système pour des cas d’utilisation simples tels que les manipulations de requêtes/réponses HTTP(s) qui peuvent être lancées par des fonctions de courte durée.
Exécutez du calcul local, une messagerie et une mise en cache de données pour les appareils connectés.
Ressources
Documents connexes :
-
Optimisation de votre infrastructure AWS pour la durabilité, partie 3 : mise en réseau
-
Fonctions clés d’Amazon CloudFront, y compris le réseau périphérique mondial CloudFront
-
Compression des requêtes HTTP dans Amazon OpenSearch Service
-
Chargement de fichiers de données comprimés d’Amazon S3 vers Amazon Redshift
Vidéos connexes :
Exemples connexes :