Administración de caché de clúster - AWSGuía prescriptiva

Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.

Administración de caché de clúster

El almacenamiento en caché es una de las funciones más importantes de cualquier base de datos (base de datos) porque ayuda a reducir la E/S del disco. Los datos a los que se accede con más frecuencia se almacenan en un área de memoria denominada caché de búfer. Cuando una consulta se ejecuta con frecuencia, recupera los datos directamente de la memoria caché en lugar del disco. Esto es más rápido y proporciona una mejor escalabilidad y rendimiento de las aplicaciones. El tamaño de la caché de PostgreSQL se configura mediante elshared_buffers parámetro. Para obtener más información, consulte Memoria (documentación de Memoria de PostgreSQL sobre Memoria).

Tras una conmutación por error, la administración de caché de clústeres (CCM) de la edición compatible con Amazon Aurora PostgreSQL está diseñada para mejorar el rendimiento de recuperación de aplicaciones y bases de datos. En una situación de conmutación por error típica sin CCM, puede que observe una degradación del rendimiento temporal, pero significativa. Esto se debe a que cuando se inicia la instancia de base de datos de conmutación por error, la caché del búfer está vacía. Una caché vacía se conoce también como caché fría. La instancia de base de datos debe leer desde el disco, lo que es más lento que leer desde la memoria caché.

Al implementar CCM, elige una instancia de base de datos de lector preferida y CCM sincroniza continuamente su memoria caché con la de la instancia de base de datos principal o de escritura. Si se produce una conmutación por error, la instancia de base de datos del lector preferido se promociona en la nueva instancia de base de datos del escritor. Como ya cuenta con una memoria caché, conocida como caché activa, esto minimiza el impacto de la conmutación por error en el rendimiento de la aplicación.

¿Cómo funciona la administración de la memoria caché de clústeres?

Las instancias de base de datos de conmutación por error se encuentran en zonas de disponibilidad diferentes a las de la instancia de base de datos principal de Writer. La instancia de base de datos del lector preferida es el objetivo de conmutación por error prioritario, que se especifica asignándole el nivel de prioridad de nivel 0.

nota

La prioridad de la capa de promoción es un valor que especifica el orden en el que se promociona el lector de Aurora en la instancia de base de datos del escritor después de un error. Los valores válidos con de 0 a 15, donde 0 es la primera prioridad y 15 la última. Para obtener más información sobre el nivel de promoción, consulte Tolerancia a errores para un clúster de base de datos de Aurora. La modificación del nivel de promoción no provoca una interrupción.

CCM sincroniza la caché de la instancia de base de datos del escritor con la instancia de base de datos del lector preferido. La instancia de base de datos del lector envía el conjunto de direcciones del búfer que están actualmente almacenadas en caché a la instancia de base de datos del escritor como un filtro Bloom. Un filtro Bloom es una estructura de datos probabilística y eficiente en memoria que se utiliza para comprobar si un elemento es miembro de un conjunto. El uso de un filtro Bloom evita que la instancia de base de datos del lector envíe repetidamente las mismas direcciones del búfer a la instancia de base de datos del escritor. Cuando la instancia de base de datos del escritor recibe el filtro Bloom, compara los bloques de su caché de búfer y envía los búferes de uso frecuente a la instancia de base de datos del lector. De forma predeterminada, un búfer se considera de uso frecuente si tiene un recuento de uso superior a tres.

El siguiente diagrama muestra cómo CCM sincroniza la memoria caché del búfer de la instancia de base de datos del escritor con la instancia de base de datos del lector preferida.

Administración de caché de clústeres configurada entre instancias de base de datos de Aurora en diferentes zonas de disponibilidad.

Para obtener más información sobre CCM, consulte Recuperación rápida después de una conmutación por error con administración de caché de clústeres para Aurora PostgreSQL (documentación de Aurora) e Introducción a la administración de la caché de clústeres de Aurora PostgreSQL (entrada deAWS blog). Para obtener instrucciones sobre cómo configurar el CCM, consulte Configuración de la administración de la caché de clústeres (documentación de Aurora).

Limitaciones

La función CCM tiene las siguientes restricciones:

  • La instancia de base de datos del lector debe tener el mismo tipo y tamaño de clase de instancia de base de datos que la instancia de base de datos del escritor, comor5.2xlarge odb.r5.xlarge.

  • CCM no es compatible con los clústeres de base de datos Aurora PostgreSQL que forman parte de bases de datos globales de Aurora PostgreSQL.

Casos de uso de la administración de caché del clúster

En algunos sectores, como el comercio minorista, la banca y las finanzas, los retrasos de solo unos pocos milisegundos pueden provocar problemas de rendimiento de las aplicaciones y provocar una pérdida significativa de negocio. Dado que el CCM ayuda a recuperar el rendimiento de las aplicaciones y las bases de datos al sincronizar continuamente la caché del búfer de la instancia de base de datos principal con la instancia de respaldo preferida, puede ayudar a evitar las pérdidas empresariales asociadas a las conmutaciones por error.