REL09-BP01 Identifier et sauvegarder toutes les données qui doivent être sauvegardées, ou reproduire les données à partir de sources

Identifiez et utilisez les fonctionnalités de sauvegarde des services et ressources de données utilisés par votre charge de travail. La plupart des services offrent des fonctionnalités permettant de sauvegarder vos données de charge de travail.

Résultat escompté : les sources de données ont été identifiées et classées en fonction de leur ordre d’importance. Définissez ensuite une stratégie de récupération des données basée sur le RPO. Cette stratégie implique soit de sauvegarder ces sources de données, soit d’avoir la capacité de reproduire des données provenant d’autres sources. En cas de perte de données, la stratégie mise en place permet la récupération ou la reproduction des données dans les RPO et RTO définis.

Phase de maturité du cloud : fondamentale

Anti-modèles courants :

Ne pas connaître toutes les sources de données pour la charge de travail ni leur ordre d’importance.
Ne pas effectuer de sauvegardes des sources de données critiques.
Sauvegarder uniquement certaines sources de données sans utiliser leur ordre d’importance comme critère.
Aucun RPO défini, ou la fréquence de sauvegarde ne parvient pas à atteindre le RPO.
Ne pas évaluer si une sauvegarde est nécessaire ou si les données peuvent être reproduites à partir d’autres sources.

Avantages liés au respect de cette bonne pratique : identifier les emplacements où les sauvegardes sont nécessaires et mettre en place un mécanisme pour créer des sauvegardes, ou être capable de reproduire les données à partir d’une source externe améliore la capacité de restauration et de récupération des données lors d’une panne.

Niveau d’exposition au risque si cette bonne pratique n’est pas respectée : élevé

Directives d’implémentation

Tous les magasins de données AWS offrent des fonctionnalités de sauvegarde. Des services comme Amazon RDS et Amazon DynamoDB prennent également en charge la sauvegarde automatisée qui permet la reprise ponctuelle (PITR). Vous pouvez ainsi restaurer une sauvegarde remontant jusqu’à cinq minutes ou moins avant l’heure actuelle. De nombreux services AWS offrent la possibilité de copier des sauvegardes vers une autre Région AWS. AWS Backup est un outil qui vous permet de centraliser et d’automatiser la protection des données dans l’ensemble des services AWS. AWS Elastic Disaster Recovery vous permet de copier les charges de travail complètes du serveur et de maintenir une protection continue des données sur site, entre les zones d’exploitation ou entre les régions, avec un objectif de point de reprise (RPO) mesuré en secondes.

Amazon S3 peut être utilisé comme destination de sauvegarde pour les sources de données autogérées et gérées par AWS. Les services AWS tels qu’Amazon EBS, Amazon RDS et Amazon DynamoDB ont des fonctionnalités intégrées permettant de créer des sauvegardes. Vous pouvez aussi utiliser des logiciels de sauvegarde tiers.

Les données sur site peuvent être sauvegardées dans le AWS Cloud avec AWS Storage Gateway ou AWS DataSync. Les compartiments Amazon S3 peuvent être utilisés pour stocker ces données sur AWS. Amazon S3 propose plusieurs niveaux de stockage tels qu’Amazon S3 Glacier ou S3 Glacier Deep Archive pour réduire les coûts du stockage de données.

Il se peut que vous puissiez répondre aux besoins de récupération de données en reproduisant les données à partir d’autres sources. Par exemple, les nœuds de réplication Amazon ElastiCache ou les répliques de lecture Amazon RDS peuvent être utilisés pour reproduire des données en cas de perte du nœud principal. Dans les cas où de telles sources peuvent être utilisées pour atteindre votre objectif de point de reprise (RPO) et votre objectif de délai de reprise (RTO), il se peut que vous n’ayez pas besoin d’une sauvegarde. Autre exemple, si vous travaillez avec Amazon EMR, il n’est peut-être pas nécessaire de sauvegarder votre magasin de données HDFS, tant que vous pouvez reproduire les données dans Amazon EMR à partir d’Amazon S3.

Lors de la sélection d’une stratégie de sauvegarde, tenez compte du temps nécessaire pour récupérer les données. Le temps nécessaire pour récupérer les données dépend du type de sauvegarde (dans le cas d’une stratégie de sauvegarde) ou de la complexité du mécanisme de reproduction des données. Cette durée doit être conforme au RTO de la charge de travail.

Étapes d’implémentation

Identifiez toutes les sources de données pour la charge de travail. Les données peuvent être stockées sur un certain nombre de ressources telles que les bases de données, les volumes, les systèmes de fichiers, les systèmes de journalisation et le stockage d’objets. Reportez-vous à la section Ressources pour trouver des documents connexes sur les différents services AWS où les données sont stockées et sur la capacité de sauvegarde que ces services fournissent.
Classez les sources de données en fonction de leur ordre d’importance. Différents jeux de données ont différents niveaux d’importance pour une charge de travail, et donc différentes exigences en matière de résilience. Par exemple, certaines données peuvent être critiques et nécessiter un RPO proche de zéro, tandis que d’autres données peuvent être moins critiques et peuvent tolérer un RPO plus élevé et la perte de certaines données. De même, différents jeux de données peuvent également avoir des exigences de RTO différentes.
Utilisez AWS ou des services tiers pour créer des sauvegardes des données. AWS Backup est un service géré qui permet de créer des sauvegardes de différentes sources de données sur AWS. AWS Elastic Disaster Recovery gère la réplication automatique des données en moins d’une seconde vers un Région AWS. La plupart des services AWS ont également des fonctionnalités natives permettant de créer des sauvegardes. AWS Marketplace inclut de nombreuses solutions qui offrent également ces fonctionnalités. Consultez Ressources ci-dessous pour découvrir comment créer des sauvegardes de données à partir de divers services AWS.
Pour les données non sauvegardées, définissez un mécanisme de reproduction des données. Vous pouvez choisir de ne pas sauvegarder les données qui peuvent être reproduites à partir d’autres sources pour diverses raisons. Il peut arriver qu’il soit moins coûteux de reproduire des données à partir de sources en cas de besoin plutôt que de créer une sauvegarde, car le stockage des sauvegardes peut impliquer un coût. Ou peut-être la restauration à partir d’une sauvegarde prend-elle plus de temps que la reproduction des données à partir des sources, ce qui entraîne une violation du RTO. Dans de telles situations, envisagez les avantages et inconvénients de chaque approche et définissez un processus clair sur la façon dont les données peuvent être reproduites à partir de ces sources lorsque la récupération des données est nécessaire. Par exemple, si vous avez chargé des données depuis Amazon S3 vers un entrepôt de données (comme Amazon Redshift) ou un cluster MapReduce (comme Amazon EMR) pour les analyser, vous disposez d’un exemple de données reproductibles à partir d’autres sources. Tant que les résultats de ces analyses sont stockés quelque part ou reproductibles, vous ne perdrez pas données en cas de défaillance de l’entrepôt de données ou du cluster MapReduce. Parmi les autres exemples reproductibles à partir de sources, figurent les caches (comme Amazon ElastiCache) ou les réplicas en lecture RDS.
Spécifiez un rythme de sauvegarde des données. La création de sauvegardes de sources de données est un processus périodique, et la fréquence doit dépendre du RPO.

Niveau d’effort du plan d’implémentation : modéré

Ressources

Bonnes pratiques associées :

REL13-BP01 Définir les objectifs de reprise en termes de durée d’indisponibilité et de perte de données

REL13-BP02 Utiliser des stratégies de reprise définies pour répondre aux objectifs de reprise

Documents connexes :

Vidéos connexes :

Avertissement JavaScript est désactivé ou n'est pas disponible dans votre navigateur.

Pour que vous puissiez utiliser la documentation AWS, Javascript doit être activé. Vous trouverez des instructions sur les pages d'aide de votre navigateur.

Conventions de rédaction

FIA 9. Comment sauvegarder les données ?

REL09-BP02 Sécuriser et chiffrer les sauvegardes