Estimation de la taille de SPICE jeux de données

Importation de données dans SPICE

Lorsque vous importez des données dans un ensemble de données plutôt que d'utiliser une SQL requête directe, elles deviennent SPICE données en raison de la façon dont elles sont stockées. SPICE (Super-fast, Parallel, In-memory Calculation Engine)est le moteur en mémoire robuste QuickSight utilisé par Amazon. Il est conçu pour effectuer des calculs avancés et traiter les données rapidement. Dans l'édition Enterprise, les données stockées dans SPICE est crypté au repos.

Lorsque vous créez ou modifiez un jeu de données, vous pouvez choisir d'utiliser SPICE ou une requête directe, sauf si le jeu de données contient des fichiers téléchargés. Importation (également appelée ingestion) de vos données dans SPICE permet d'économiser du temps et de l'argent :

Vos requêtes analytiques sont traitées plus rapidement.
Vous n'avez pas besoin d'attendre qu'une requête directe soit traitée.
Données stockées dans SPICE peut être réutilisé plusieurs fois sans frais supplémentaires. Si vous utilisez une source de données facturée à l'interrogation, vous êtes facturé pour l'interrogation des données lors de la création du jeu de données et plus tard lorsque vous actualisez le jeu de données.

SPICE la capacité est allouée séparément pour chacun d'entre eux Région AWS. Par défaut SPICE la capacité est automatiquement attribuée à votre domicile Région AWS. Pour chaque AWS compte, SPICE la capacité est partagée par toutes les personnes qui QuickSight l'utilisent Région AWS. Les autres n' Régions AWS ont pas SPICE capacité, sauf si vous choisissez d'en acheter. QuickSight les administrateurs peuvent voir combien SPICEla capacité que vous avez dans chacune d'elles Région AWS et la quantité actuellement utilisée. Un QuickSight administrateur peut en acheter d'autres SPICE capacité ou sortie non utilisée SPICE capacité selon les besoins. Pour de plus amples informations, veuillez consulter Gestion SPICE capacité de mémoire.

Rubriques

Estimation de la taille de SPICE jeux de données

Estimation de la taille de SPICE jeux de données

La taille d'un jeu de données dans SPICE par rapport à celui de votre compte SPICE la capacité est appelée taille logique. La taille logique d'un jeu de données n'est pas la même que la taille du fichier ou de la table source du jeu de données. Le calcul de la taille logique d'un jeu de données intervient après que toutes les transformations de type de données et les colonnes calculées ont été définies lors de la préparation des données. Ces champs sont matérialisés dans SPICE d'une manière qui améliore les performances des requêtes. Les modifications que vous apportez à une analyse n'ont aucun effet sur la taille logique des données dans SPICE. Seules les modifications enregistrées dans le jeu de données s'appliquent à SPICE capacité.

La taille logique d'un SPICE l'ensemble de données dépend des types de données des champs du jeu de données et du nombre de lignes du jeu de données. Les trois types de SPICE les données sont des décimales, des dates et des chaînes de caractères. Vous pouvez transformer le type de données d'un champ pendant la phase de préparation des données pour l'adapter à vos besoins de représentation visuelle des données. Par exemple, le fichier que vous souhaitez importer peut contenir toutes les chaînes (texte). Mais pour qu'elles puissent être utilisées de façon significative dans une analyse, vous préparez les données en modifiant les types de données selon leur forme appropriée. Les champs contenant des prix peuvent être transformés de chaînes en décimales, et les champs contenant des dates peuvent être transformés de chaînes en dates. Vous pouvez également créer des champs calculés et exclure de la table source les champs dont vous n'avez pas besoin. Lorsque vous avez fini de préparer votre jeu de données et que toutes les transformations sont terminées, vous pouvez estimer la taille logique du schéma final.

Note

Les types de données géospatiales utilisent les métadonnées pour interpréter le type de données physique. La latitude et la longitude sont numériques. Toutes les autres catégories géospatiales sont des chaînes.

Dans la formule ci-dessous, les décimales et les dates sont calculées sur la base de 8 octets par cellule, avec 4 octets supplémentaires pour les données auxiliaires. Les chaînes sont calculées en fonction de la longueur du texte en codage UTF -8 plus 24 octets pour le codage auxiliaire. Les types de données de chaîne nécessitent plus d'espace en raison de l'indexation supplémentaire requise par SPICE pour fournir des performances de requête élevées.


Logical dataset size in bytes =
(Number of Numeric cells *  (12 bytes per cell))
+ (Number of Date cells    *  (12 bytes per cell))
+ SUM ((24 bytes + UTF-8 encoded length) per Text cell)

La formule ci-dessus ne doit être utilisée que pour estimer la taille d'un seul ensemble de données dans SPICE. Le SPICE l'utilisation de la capacité est la taille totale de tous les ensembles de données d'un compte dans une région spécifique. Il est déconseillé d'utiliser cette formule pour estimer le total SPICE capacité utilisée par votre compte.

Avertissement JavaScript est désactivé ou n'est pas disponible dans votre navigateur.

Pour que vous puissiez utiliser la documentation AWS, Javascript doit être activé. Vous trouverez des instructions sur les pages d'aide de votre navigateur.

Conventions de rédaction

Actualisation des données

rafraîchissant SPICE data