PERF03-BP04 Implementar estrategias para mejorar el rendimiento de las consultas en el almacén de datos - Pilar de eficiencia del rendimiento

PERF03-BP04 Implementar estrategias para mejorar el rendimiento de las consultas en el almacén de datos

Implemente estrategias que permitan optimizar los datos y mejorar las consultas para aumentar la escalabilidad y conseguir un rendimiento eficiente para su carga de trabajo.

Antipatrones usuales:

  • No divide en particiones los datos en su almacén de datos.

  • Almacena los datos en un solo formato en su almacén de datos.

  • No utiliza índices en su almacén de datos.

    Ventajas de aplicar esta práctica recomendada: al optimizar el rendimiento de los datos y las consultas, se consigue una mayor eficiencia, una reducción de los costes y una mejor experiencia de usuario.

Nivel de riesgo expuesto si no se establece esta práctica recomendada: medio

Guía para la implementación

La optimización de los datos y el ajuste de las consultas son aspectos fundamentales en la eficiencia del rendimiento de un almacén de datos, ya que afectan al rendimiento y a la capacidad de respuesta de toda la carga de trabajo en la nube. Las consultas que no están optimizadas pueden aumentar el uso de recursos y generar cuellos de botella, lo que reduce la eficiencia general de los almacenes de datos.

La optimización de datos incluye diversas técnicas que garantizan la eficiencia del almacenamiento de datos y su acceso. Esto también ayuda a mejorar el rendimiento de las consultas en un almacén de datos. Algunas de las estrategias clave son la partición, la compresión y la desnormalización de los datos, lo que ayuda a optimizarlos tanto a la hora de almacenarlos como de acceder a ellos.

Pasos para la implementación

  • Estudie y analice las consultas de datos críticos que se realizan en el almacén de datos.

  • Identifique las consultas de ejecución lenta del almacén de datos y utilice planes de consulta para conocer su estado actual.

  • Implemente estrategias para mejorar el rendimiento de las consultas. Algunas de las estrategias clave son:

    • Usar un formato de archivo en columnas (como Parquet u ORC).

    • Comprimir los datos en el almacén de datos para reducir el espacio de almacenamiento y la operación de E/S.

    • Crear particiones de datos para dividir la información en partes más pequeñas y reducir el tiempo de análisis de los datos.

    • Indexar los datos de las columnas más frecuentes de la consulta.

    • Elegir la operación de unión correcta para la consulta. Cuando una dos tablas, especifique la tabla mayor en el lado izquierdo de la unión y la tabla menor en el lado derecho de la unión.

    • Usar una solución de almacenamiento en caché distribuida para mejorar la latencia y reducir la cantidad de operaciones de E/S de la base de datos.

    • Realizar un mantenimiento regular, como la ejecución de estadísticas.

  • Experimente y pruebe estrategias en un entorno que no sea de producción.

Recursos

Documentos relacionados:

Vídeos relacionados:

Ejemplos relacionados: