PERF03-BP04 Mise en œuvre de stratégies pour améliorer les performances des requêtes dans un magasin de données
Mettez en œuvre des stratégies pour optimiser les données et améliorer les requêtes sur les données afin de renforcer la capacité de mise à l’échelle et l’efficacité des performances pour votre charge de travail.
Anti-modèles courants :
-
Vous ne partitionnez pas les données dans votre magasin de données.
-
Vous ne stockez les données que dans un seul format de fichier dans votre magasin de données.
-
Vous n’utilisez pas d’index dans votre magasin de données.
Avantages liés au respect de cette bonne pratique : en optimisant les performances des données et des requêtes, vous augmentez leur efficacité, vous réduisez les coûts et vous améliorez l’expérience utilisateur.
Niveau de risque encouru si cette bonne pratique n’est pas respectée : moyen
Directives d’implémentation
L’optimisation des données et des requêtes sont des aspects essentiels de l’efficacité des performances d’un magasin de données, car ils ont un impact sur les performances et la réactivité de l’ensemble de la charge de travail dans le cloud. Les données non optimisées peuvent augmenter l’utilisation des ressources et les goulots d’étranglement, ce qui réduit l’efficacité globale d’un magasin de données.
L’optimisation des données inclut plusieurs techniques pour garantir un stockage de données et un accès aux données efficaces. Cela permet également d’améliorer les performances des requêtes dans un magasin de données. Les principales stratégies incluent le partitionnement des données, la compression des données et la dénormalisation des données, qui permettent d’optimiser les données à la fois pour le stockage et l’accès.
Étapes d’implémentation
-
Comprenez et analysez les requêtes essentielles sur les données effectuées dans votre magasin de données.
-
Identifiez les requêtes lentes dans votre magasin de données et utilisez des plans de requêtes pour comprendre leur état actuel.
-
Mettez en œuvre des stratégies pour améliorer les performances des requêtes. Les stratégies clés incluent :
-
L’utilisation d’un format de fichier en colonnes (comme Parquet ou ORC).
-
La compression des données dans le magasin de données pour réduire l’espace de stockage et les opérations d’E/S.
-
Le partitionnement des données pour diviser les données en parties plus petites et réduire le temps d’analyse des données.
-
L’indexation des données sur les colonnes communes de la requête.
-
Utilisez des vues matérialisées pour les requêtes fréquentes.
-
Choisissez l’opération de jointure appropriée pour la requête. Lorsque vous joignez deux tables, spécifiez la table la plus grande sur le côté gauche de la jointure et la plus petite sur le côté droit de la jointure.
-
La solution de mise en cache distribué pour améliorer la latence et réduire le nombre d’opérations d’E/S dans la base de données.
-
Maintenance régulière, telle que l’aspiration, la réindexation et les statistiques d’exécution.
-
-
Expérimentez et testez les stratégies dans un environnement hors production.
Ressources
Documents connexes :
Vidéos connexes :
Exemples connexes :