Importación de datos en SPICE - Amazon QuickSight

Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.

Importación de datos en SPICE

Cuando importas datos a un conjunto de datos en lugar de utilizar una consulta SQL directa, se convierten en SPICEdatos por la forma en que se almacenan. SPICE (Super-fast, Parallel, In-memory Calculation Engine)es el robusto motor en memoria que QuickSight utiliza Amazon. Está diseñado para realizar cálculos avanzados y ofrecer datos de forma rápida. En Enterprise Edition, los datos almacenados en SPICE se cifran en reposo.

Al crear o editar un conjunto de datos, puede elegir entre utilizar una consulta de SPICE o una consulta directa, a menos que el conjunto de datos contenga archivos cargados. La importación (también denominada ingesta) de sus datos a SPICE puede ahorrar tiempo y dinero:

  • Sus consultas analíticas se procesan más rápido.

  • No tiene que esperar a que se procese una consulta directa.

  • Los datos almacenados en SPICE se pueden reutilizar varias veces sin incurrir en costos adicionales. Si utiliza un origen de datos que cobra por consulta, se le cobrará por consultar los datos cuando cree el conjunto de datos por primera vez y, más adelante, cuando lo actualice.

La capacidad de SPICE se asigna por separado para cada Región de AWS. La capacidad de SPICE predeterminada se asigna automáticamente a su Región de AWS. Para cada AWS cuenta, SPICE la capacidad la comparten todas las personas que utilizan QuickSight una sola Región de AWS cuenta. Las demás no Regiones de AWS tienen SPICE capacidad a menos que decidas comprarlas. QuickSight los administradores pueden ver cuánta SPICEcapacidad tiene en cada una de ellas Región de AWS y cuánta de ella está en uso actualmente. Un QuickSight administrador puede adquirir más SPICE capacidad o liberar la SPICE capacidad no utilizada según sea necesario. Para obtener más información, consulte Administración de la capacidad de memoria de SPICE.

Estimación del tamaño de los conjuntos de datos SPICE

El tamaño de un conjunto de datos en SPICE relación con la SPICE capacidad de la cuenta se denomina tamaño lógico. El tamaño lógico de un conjunto de datos no es el mismo que el tamaño del archivo o la tabla fuente del conjunto de datos. El cálculo del tamaño lógico de un conjunto de datos se produce después de definir todas las transformaciones de los tipos de datos y las columnas calculadas durante la preparación de los datos. Estos campos se materializan de una SPICE manera que mejora el rendimiento de las consultas. Los cambios que realice en un análisis no afectarán al tamaño lógico de los datos que contiene. SPICE Solo los cambios que se guardan en el conjunto de datos se aplican a la SPICE capacidad.

El tamaño lógico de un SPICE conjunto de datos depende de los tipos de datos de los campos del conjunto de datos y del número de filas del conjunto de datos. Los tres tipos de SPICE datos son decimales, fechas y cadenas. Puede transformar el tipo de datos de un campo durante la fase de preparación de los datos para adaptarlo a sus necesidades de visualización de datos. Por ejemplo, el archivo que desea importar puede contener todas las cadenas (texto). Sin embargo, para que se utilicen de manera significativa en un análisis, debe preparar los datos cambiando los tipos de datos a su forma adecuada. Los campos que contienen precios se pueden cambiar de cadenas a decimales, y los campos que contienen fechas se pueden cambiar de cadenas a fechas. También puede crear campos calculados y excluir de la tabla de origen los campos que no necesite. Cuando haya terminado de preparar el conjunto de datos y se hayan completado todas las transformaciones, podrá estimar el tamaño lógico del esquema final.

nota

Los tipos de datos geoespaciales utilizan metadatos para interpretar el tipo de datos físicos. La latitud y la longitud son numéricos. Todas las demás categorías geoespaciales son cadenas.

En la siguiente fórmula, los decimales y las fechas se calculan como 8 bytes por celda con 4 bytes adicionales como auxiliares. Las cadenas se calculan en función de la longitud del texto en la codificación UTF-8 más 24 bytes en la codificación auxiliar. Los tipos de datos de cadena requieren más espacio debido a la indexación adicional necesaria SPICE para proporcionar un alto rendimiento de consulta.

Logical dataset size in bytes = (Number of Numeric cells * (12 bytes per cell)) + (Number of Date cells * (12 bytes per cell)) + SUM ((24 bytes + UTF-8 encoded length) per Text cell)

La fórmula anterior solo debe usarse para estimar el tamaño de un único conjunto de datos. SPICE El uso de la SPICE capacidad es el tamaño total de todos los conjuntos de datos de una cuenta en una región específica. No se recomienda utilizar esta fórmula para estimar la SPICE capacidad total que utiliza la cuenta.