Paso 3: Establecer la capacidad de rendimiento de la tabla - Amazon Keyspaces (para Apache Cassandra)

Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.

Paso 3: Establecer la capacidad de rendimiento de la tabla

En este tutorial se muestra cómo ajustar DSBulk para que cargue los datos dentro de un intervalo de tiempo establecido. Dado que sabe de antemano cuántas lecturas y escrituras realiza, utilice el modo de capacidad aprovisionada. Una vez finalizada la transferencia de datos, debe ajustar el modo de capacidad de la tabla para que se adapte a los patrones de tráfico de su aplicación. Para obtener más información sobre administración de capacidad, consulte Administración de recursos sin servidor en Amazon Keyspaces (para Apache Cassandra).

Con el modo de capacidad aprovisionada, usted especifica con antelación cuánta capacidad de lectura y escritura desea aprovisionar a su tabla. La capacidad de escritura se factura por hora y se mide en unidades de capacidad de escritura (WCU). Cada WCU es capacidad de escritura suficiente para admitir la escritura de 1 KB de datos por segundo. Al cargar los datos, la tasa de escritura debe estar por debajo de las WCU máximas (parámetro: write_capacity_units) que se hayan establecido en la tabla de destino.

De forma predeterminada, puede aprovisionar hasta 40 000 WCU en una tabla y 80 000 WCU en todas las tablas de su cuenta. Si necesita capacidad adicional, puede solicitar un aumento de cuota en la consola de Service Quotas. Para obtener más información acerca de las cuotas, consulte Cuotas para Amazon Keyspaces (para Apache Cassandra).

Cálculo del número medio de WCU necesarias para una inserción

Insertar 1 KB de datos por segundo requiere 1 WCU. Si su archivo CSV tiene 360 000 filas y quiere cargar todos los datos en 1 hora, debe escribir 100 filas por segundo (360 000 filas / 60 minutos / 60 segundos = 100 filas por segundo). Si cada fila tiene hasta 1 KB de datos, para insertar 100 filas por segundo, debe aprovisionar 100 WCU a su tabla. Si cada fila tiene 1,5 KB de datos, necesita 2 WCU para insertar una fila por segundo. Por tanto, para insertar 100 filas por segundo, debe aprovisionar 200 WCU.

Para determinar cuántas WCU necesita para insertar una fila por segundo, divida el tamaño medio de la fila en bytes por 1024 y redondee al número entero más próximo.

Por ejemplo, si el tamaño medio de las filas es de 3000 bytes, necesita 3 WCU para insertar una fila por segundo.

ROUNDUP(3000 / 1024) = ROUNDUP(2.93) = 3 WCUs
Cálculo de capacidad y tiempo de carga de datos

Ahora que conoce el tamaño medio y el número de filas de su archivo CSV, puede calcular cuántas WCU necesita para cargar los datos en un tiempo determinado y el tiempo aproximado que se tarda en cargar todos los datos de su archivo CSV utilizando diferentes ajustes de WCU.

Por ejemplo, si cada fila de su archivo es de 1 KB y tiene 1 000 000 de filas en su archivo CSV, para cargar los datos en 1 hora, necesita aprovisionar al menos 278 WCU a su tabla para esa hora.

1,000,000 rows * 1 KBs = 1,000,000 KBs 1,000,000 KBs / 3600 seconds =277.8 KBs / second = 278 WCUs
Configuración de los ajustes de capacidad aprovisionada

Puede configurar los ajustes de capacidad de escritura de una tabla al crearla o mediante el comando ALTER TABLE. A continuación se muestra la sintaxis para modificar los ajustes de capacidad aprovisionada de una tabla con el comando ALTER TABLE.

ALTER TABLE catalog.book_awards WITH custom_properties={'capacity_mode':{'throughput_mode': 'PROVISIONED', 'read_capacity_units': 100, 'write_capacity_units': 278}} ;

Para ver la referencia completa del lenguaje, consulte CREATE TABLE y ALTER TABLE.