SPICE へのデータのインポート - Amazon QuickSight

SPICE へのデータのインポート

ダイレクト SQL クエリを使用する代わりにデータをデータセットにインポートすると、データはその保存方法のために SPICE データになります。SPICE (Super-fast, Parallel, In-memory Calculation Engine) は、Amazon QuickSight が使用する堅牢なインメモリエンジンです。SPICE は、高度な計算を迅速に実行し、データを提供するように設計されています。Enterprise Edition では、SPICE に保存されるデータが保管時に暗号化されます。

データセットを作成または編集するときは、データセットにアップロードされたファイルが含まれている場合を除き、SPICE または直接クエリの使用を選択します。SPICE にデータをインポートする (取り込むとも言います) ことにより、時間とコストを節約できます。

  • 分析クエリの処理速度が速くなる。

  • 直接クエリが処理されるまで待つ必要がない。

  • SPICE に保存されたデータは、追加コストを発生させることなく複数回再利用できる。クエリごとに課金されるデータソースを使用すると、最初にデータセットを作成するときと、後でデータセットを更新するときに、データのクエリに対して課金されます。

SPICE 容量は AWS リージョンごとに個別に割り当てられ、ホーム AWS リージョンにデフォルトの SPICE 容量が自動的に割り当てられます。各 AWS アカウントでは、単一の AWS リージョンで QuickSight を使用しているすべてのユーザーが SPICE 容量を共有します。容量を別途購入しない限り、他の AWS リージョンに SPICE 容量は割り当てられません。QuickSight の管理者は、各 AWS リージョンで利用できる SPICE 容量と、そのうちで現在使用中の容量を確認できます。QuickSight の管理者は、必要に応じて SPICE 容量を追加購入する、または未使用の SPICE 容量を解放することができます。詳細については、「SPICE メモリ容量の管理」を参照してください。

SPICE データセットのサイズの推定

アカウントの SPICE キャパシティに対する SPICE のデータセットのサイズは、論理サイズと呼ばれます。データセットの論理サイズは、データセットのソースファイルまたはテーブルのサイズと同じではありません。データセットの論理サイズの計算は、データの準備中にすべてのデータ型変換と計算列が定義された後に行われます。これらのフィールドは、クエリパフォーマンスを向上させるように SPICE でマテリアライズされます。分析で行われる変更は、SPICE 内のデータの論理サイズに影響を及ぼしません。データセットで保存された変更のみが SPICE 容量に適用されます。

SPICE データセットの論理サイズは、データセットフィールドのデータ型と、データセット内の行数によって異なります。SPICE データの 3 つの種類とは、小数、日付、文字列です。データビジュアライゼーションのニーズに合わせて、データの準備段階でフィールドのデータ型を変換できます。例えば、インポートするファイルには、すべての文字列 (テキスト) が含まれている場合があります。しかし、これらを分析で有効に活用するには、データ型を適切な形式に変更してデータを準備します。料金を含むフィールドは文字列から小数に変更でき、日付を含むフィールドは文字列から日付に変更できます。計算フィールドを作成し、ソーステーブルから不要なフィールドを除外することもできます。データセットの準備が完了し、すべての変換が完了したら、最終的なスキーマの論理サイズを見積もることができます。

注記

地理空間データ型は、メタデータを使用して物理データ型を解釈します。緯度と経度は数値です。その他のすべての地理空間カテゴリは文字列です。

以下の式では、小数点と日付はセルあたり 8 バイトとして計算され、補助のために 4 バイトが追加されます。文字列は、UTF-8 エンコーディングでのテキストの長さに、補助のための 24 バイトを加えたものに基づいて計算されます。文字列のデータ型では、高いクエリパフォーマンスを実現するために SPICE によって追加のインデックス作成が必要とされるため、より多くの領域が必要になります。

Logical dataset size in bytes = (Number of Numeric cells * (12 bytes per cell)) + (Number of Date cells * (12 bytes per cell)) + SUM ((24 bytes + UTF-8 encoded length) per Text cell)

上記の式は、SPICE 内の単一のデータセットのサイズを推定する場合にのみ使用される必要があります。SPICE キャパシティの使用量は、特定のリージョンのアカウント内のすべてのデータセットの合計サイズです。アカウントが使用している SPICE キャパシティの合計を見積もるためにこの式を使用することは推奨されていません。