Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.
SUS04-BP05 Supprimer les données inutiles ou redondantes
Supprimez les données inutiles ou redondantes pour minimiser les ressources de stockage requises pour stocker vos jeux de données.
Anti-modèles courants :
-
Vous dupliquez des données qui peuvent être facilement obtenues ou recréées.
-
Vous sauvegardez toutes les données sans tenir compte de leur criticité.
-
Vous ne supprimez les données que de façon irrégulière, sur les événements opérationnels ou pas du tout.
-
Vous stockez les données de manière redondante, quelle que soit la durabilité du service de stockage.
-
Vous activez la gestion des versions sans aucune justification commerciale.
Avantages liés au respect de cette bonne pratique : la suppression des données inutiles réduit la taille de stockage requise pour votre charge de travail et son impact environnemental.
Niveau de risque encouru si cette bonne pratique n’est pas respectée : moyen
Directives d’implémentation
Ne stockez pas les données dont vous n’avez pas besoin. Automatisez la suppression des données inutiles. Utilisez des technologies qui dédupliquent les données au niveau du fichier et du bloc. Utilisez la réplication des données native et les fonctionnalités de redondance des services.
Étapes d’implémentation
-
Évaluez si vous pouvez éviter de stocker des données en utilisant des ensembles de données accessibles au public existants dans AWS Data Exchange
et des données ouvertes sur AWS . -
Utilisez des mécanismes qui peuvent dédupliquer les données au niveau du bloc et de l’objet. Voici quelques exemples illustrant comment dédupliquer des données sur AWS :
Service de stockage Mécanismes de déduplication Permet AWS Lake Formation FindMatches
de rechercher les enregistrements correspondants dans un ensemble de données (y compris ceux sans identifiant) à l'aide du nouveau FindMatches ML Transform. Utilisez la déduplication des données sur Amazon FSx pour Windows.
Les instantanés sont des sauvegardes incrémentielles, ce qui signifie que seuls les blocs de l’appareil qui ont changé depuis l’instantané le plus récent sont enregistrés.
-
Analysez l’accès aux données pour identifier les données inutiles. Automatisez les politiques de cycle de vie. Tirez parti des fonctionnalités de service natives telles qu'Amazon DynamoDB Time To Live, Amazon S3 Lifecycle ou CloudWatch Amazon Log Retention pour suppression.
-
Utilisez les fonctionnalités de virtualisation des données AWS pour conserver les données à leur source et éviter la duplication des données.
-
Utilisez une technologie de sauvegarde qui peut réaliser des sauvegardes incrémentielles.
-
Tirez parti de la durabilité d'Amazon S3 et de la réplication d'Amazon EBS pour atteindre vos objectifs de durabilité au lieu de recourir à des technologies autogérées (telles qu'un ensemble redondant de disques indépendants (RAID)).
-
Centralisez les données de journalisation et de suivi, dédupliquez les entrées de journal identiques et établissez des mécanismes pour ajuster le niveau d’informations transmises, le cas échéant.
-
Préremplissez les caches uniquement lorsque cela est justifié.
-
Établissez la surveillance et l’automatisation des caches pour redimensionner correctement les caches.
-
Supprimez les out-of-date déploiements et les actifs des magasins d'objets et des caches périphériques lorsque vous importez de nouvelles versions de votre charge de travail.
Ressources
Documents connexes :
-
Conservation des données du journal des modifications dans CloudWatch les journaux
-
Déduplication des données sur le serveur FSx de fichiers Amazon pour Windows
-
Fonctionnalités d'Amazon FSx pour ONTAP inclure la déduplication des données
-
Utilisation AWS Backup pour sauvegarder et restaurer les systèmes de EFS fichiers Amazon
-
Intégrez et dédupliquez des ensembles de données à l'aide de AWS Lake Formation
Vidéos connexes :
Exemples connexes :