翻訳は機械翻訳により提供されています。提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。
のデータ形式 AWS Clean Rooms
データをクエリするには、データセットが が AWS Clean Rooms サポートする形式である必要があります。データセットと AWS Clean Rooms クラスターを含む Amazon S3 バケットは、同じ にある必要があります AWS リージョン。
サポートされているデータ形式
AWS Clean Rooms では、次の構造化形式がサポートされています。
-
Parquet
-
RCFile
-
TextFile
-
SequenceFile
-
RegexSerde
-
OpenCSV
-
AVRO
-
JSON
注記
テキストファイル内の timestamp
値は、yyyy-MM-dd
HH:mm:ss.SSSSSS
の形式である必要があります。例えば、2017-05-01 11:30:59.000000
です。
Apache Parquet など、列指向ストレージファイル形式を使用することをお勧めします。列指向ストレージファイル形式により、必要な列のみを選択し、Amazon S3 からのデータ転送を最小限に抑えることができます。最適なパフォーマンスを得るには、大きなオブジェクトを 100 MB ~ 1 GB のオブジェクトに分割する必要があります。
サポートされているデータ型
で最適なエクスペリエンスを得るには AWS Clean Rooms、すべてのデータを でカタログ化する必要があります AWS Glue。詳細については、「AWS Glue デベロッパーガイド」の「AWS Glue Data Catalogの開始方法」を参照してください。
AWS Clean Rooms は、次の AWS Glue Data Catalog データ型をサポートしています。
-
bigint
-
boolean
-
char
-
date
-
decimal
-
double
-
float
-
int
-
以下のようなネストされたデータ型
-
array
-
map
-
struct
-
-
smallint
-
string
-
timestamp
-
varchar
AWS Clean Rooms は以下をサポートしていません。
-
バイナリ
-
interval
のファイル圧縮タイプ AWS Clean Rooms
ストレージスペースの縮小、パフォーマンスの向上、コストの最小化を行うため、データセットを圧縮することを強くお勧めします。
AWS Clean Rooms は、ファイル拡張子に基づいてファイル圧縮タイプを認識し、次の表に示す圧縮タイプと拡張子をサポートします。
圧縮アルゴリズム | ファイル拡張子 |
---|---|
GZIP | .gz |
Bzip2 | .bz2 |
Snappy | .snappy |
さまざまなレベルで圧縮を適用できます。通常、ファイル全体を圧縮するか、ファイル内の個々のブロックを圧縮します。ファイルレベルで列形式を圧縮しても、パフォーマンス上の利点はありません。
のサーバー側の暗号化 AWS Clean Rooms
注記
暗号化コンピューティングを必要とするユースケースで、サーバー側の暗号化が代わりの役割を果たすことはありません。
AWS Clean Rooms は、次の暗号化オプションを使用して暗号化されたデータセットを透過的に復号します。
-
SSE-S3 – Amazon S3 によって管理される AES-256 暗号化キーを使用したサーバー側の暗号化
-
SSE-KMS – によって管理されるキーによるサーバー側の暗号化 AWS Key Management Service
SSE-S3 を使用するには、設定済みテーブルをコラボレーションに関連付けるために使用される AWS Clean Rooms サービスロールに KMS-decrypt アクセス許可が必要です。SSE- を使用するにはKMS、KMSキーポリシーで AWS Clean Rooms サービスロールの復号も許可する必要があります。
AWS Clean Rooms は Amazon S3 クライアント側の暗号化をサポートしていません。サーバー側の暗号化の詳細については、「Amazon Simple Storage Service ユーザーガイド」の「サーバー側の暗号化によるデータの保護」を参照してください。