PERF03-BP04 Implementación de estrategias para mejorar el rendimiento de las consultas en el almacén de datos
Implemente estrategias que permitan optimizar los datos y mejorar las consultas para aumentar la escalabilidad y conseguir un rendimiento eficiente para su carga de trabajo.
Patrones comunes de uso no recomendados:
-
No divide en particiones los datos en su almacén de datos.
-
Almacena los datos en un solo formato en su almacén de datos.
-
No utiliza índices en su almacén de datos.
Beneficios de establecer esta práctica recomendada: al optimizar el rendimiento de los datos y las consultas, se consigue una mayor eficiencia, una reducción de los costos y una mejor experiencia de usuario.
Nivel de riesgo expuesto si no se establece esta práctica recomendada: medio
Guía para la implementación
La optimización de los datos y el ajuste de las consultas son aspectos fundamentales en la eficiencia del rendimiento de un almacén de datos, ya que afectan al rendimiento y a la capacidad de respuesta de toda la carga de trabajo en la nube. Las consultas que no están optimizadas pueden aumentar el uso de recursos y generar cuellos de botella, lo que reduce la eficiencia general de los almacenes de datos.
La optimización de datos incluye diversas técnicas que garantizan la eficiencia del almacenamiento de datos y su acceso. Esto también ayuda a mejorar el rendimiento de las consultas en un almacén de datos. Algunas de las estrategias clave son la partición, la compresión y la desnormalización de los datos, lo que ayuda a optimizarlos tanto a la hora de almacenarlos como de acceder a ellos.
Pasos para la implementación
-
Estudie y analice las consultas de datos críticos que se llevan a cabo en el almacén de datos.
-
Identifique las consultas de procesamiento lento del almacén de datos y utilice planes de consulta para conocer su estado actual.
-
Implemente estrategias para mejorar el rendimiento de las consultas. Algunas de las estrategias clave son:
-
Usar un formato de archivo de columnas (como Parquet u ORC).
-
Comprimir los datos en el almacén de datos para reducir el espacio de almacenamiento y la operación de E/S.
-
Crear particiones de datos para dividir la información en partes más pequeñas y reducir el tiempo de análisis de los datos.
-
Indexar los datos de las columnas más frecuentes de la consulta.
-
Utilizar vistas materializadas para consultas frecuentes.
-
Elegir la operación de unión correcta para la consulta. Cuando una dos tablas, especifique la tabla mayor en el lado izquierdo de la unión y la tabla menor en el lado derecho de la unión.
-
Usar una solución de almacenamiento en caché distribuida para mejorar la latencia y reducir la cantidad de operaciones de E/S de la base de datos.
-
Llevar a cabo un mantenimiento periódico, como vacío, reindexación y ejecución de estadísticas.
-
-
Experimente y pruebe estrategias en un entorno que no sea de producción.
Recursos
Documentos relacionados:
Videos relacionados:
Ejemplos relacionados: