のデータ形式 AWS Clean Rooms - AWS Clean Rooms

翻訳は機械翻訳により提供されています。提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。

のデータ形式 AWS Clean Rooms

データをクエリするには、データセットが が AWS Clean Rooms サポートする形式である必要があります。データセットと AWS Clean Rooms クラスターを含む Amazon S3 バケットは、同じ にある必要があります AWS リージョン。

サポートされているデータ形式

AWS Clean Rooms では、次の構造化形式がサポートされています。

注記

テキストファイル内の timestamp 値は、yyyy-MM-dd HH:mm:ss.SSSSSS の形式である必要があります。例えば、2017-05-01 11:30:59.000000 です。

Apache Parquet など、列指向ストレージファイル形式を使用することをお勧めします。列指向ストレージファイル形式により、必要な列のみを選択し、Amazon S3 からのデータ転送を最小限に抑えることができます。最適なパフォーマンスを得るには、大きなオブジェクトを 100 MB ~ 1 GB のオブジェクトに分割する必要があります。

サポートされているデータ型

で最適なエクスペリエンスを得るには AWS Clean Rooms、すべてのデータを でカタログ化する必要があります AWS Glue。詳細については、「AWS Glue デベロッパーガイド」の「AWS Glue Data Catalogの開始方法」を参照してください。

AWS Clean Rooms は、次の AWS Glue Data Catalog データ型をサポートしています。

  • bigint

  • boolean

  • char

  • date

  • decimal

  • double

  • float

  • int

  • 以下のようなネストされたデータ型

    • array

    • map

    • struct

  • smallint

  • string

  • timestamp

  • varchar

AWS Clean Rooms は以下をサポートしていません。

  • バイナリ

  • interval

のファイル圧縮タイプ AWS Clean Rooms

ストレージスペースの縮小、パフォーマンスの向上、コストの最小化を行うため、データセットを圧縮することを強くお勧めします。

AWS Clean Rooms は、ファイル拡張子に基づいてファイル圧縮タイプを認識し、次の表に示す圧縮タイプと拡張子をサポートします。

圧縮アルゴリズム ファイル拡張子
GZIP .gz
Bzip2 .bz2
Snappy .snappy

さまざまなレベルで圧縮を適用できます。通常、ファイル全体を圧縮するか、ファイル内の個々のブロックを圧縮します。ファイルレベルで列形式を圧縮しても、パフォーマンス上の利点はありません。

のサーバー側の暗号化 AWS Clean Rooms

注記

暗号化コンピューティングを必要とするユースケースで、サーバー側の暗号化が代わりの役割を果たすことはありません。

AWS Clean Rooms は、次の暗号化オプションを使用して暗号化されたデータセットを透過的に復号します。

  • SSE-S3 – Amazon S3 によって管理される AES-256 暗号化キーを使用したサーバー側の暗号化

  • SSE-KMS – によって管理されるキーによるサーバー側の暗号化 AWS Key Management Service

SSE-S3 を使用するには、設定済みテーブルをコラボレーションに関連付けるために使用される AWS Clean Rooms サービスロールに KMS-decrypt アクセス許可が必要です。SSE- を使用するにはKMS、KMSキーポリシーで AWS Clean Rooms サービスロールの復号も許可する必要があります。

AWS Clean Rooms は Amazon S3 クライアント側の暗号化をサポートしていません。サーバー側の暗号化の詳細については、「Amazon Simple Storage Service ユーザーガイド」の「サーバー側の暗号化によるデータの保護」を参照してください。