Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.
Format data untuk AWS Clean Rooms
Kumpulan data yang Anda gunakan untuk kueri biasanya AWS Clean Rooms adalah jenis kumpulan data yang sama yang Anda gunakan untuk aplikasi lain. Misalnya, jenis kumpulan data yang sama digunakan dengan Amazon Athena, Amazon EMR, Amazon Redshift Spectrum, dan Amazon. QuickSight Anda dapat menanyakan data dalam format aslinya langsung dari Amazon Simple Storage Service (Amazon S3).
Untuk kueri data, kumpulan data harus dalam format yang AWS Clean Rooms mendukung. Bucket Amazon S3 dengan kumpulan data dan AWS Clean Rooms cluster harus sama. Wilayah AWS
Format data yang didukung
AWS Clean Rooms mendukung format terstruktur berikut:
-
Parquet
-
RCFile
-
TextFile
-
SequenceFile
-
RegexSerde
-
OpenCSV
-
AVRO
-
JSON
catatan
timestamp
Nilai dalam file teks harus dalam formatyyyy-MM-dd
HH:mm:ss.SSSSSS
. Misalnya:2017-05-01 11:30:59.000000
.
Sebaiknya gunakan format file penyimpanan kolumnar, seperti. Apache Parquet Dengan format file penyimpanan kolumnar, Anda dapat meminimalkan transfer data dari Amazon S3 dengan memilih hanya kolom yang Anda butuhkan. Untuk kinerja optimal, objek besar harus dibagi menjadi objek 100mb—1gb.
Jenis data yang didukung
Untuk pengalaman yang optimal AWS Clean Rooms, semua data Anda harus dikatalogkan. AWS Glue Untuk informasi selengkapnya, lihat bagian berjudul Memulai dengan AWS Glue Data Catalog di Panduan AWS Glue Pengembang.
AWS Clean Rooms mendukung tipe AWS Glue Data Catalog data berikut:
-
bigint
-
boolean
-
char
-
date
-
decimal
-
double
-
float
-
int
-
Tipe data bersarang seperti:
-
array
-
map
-
struct
-
-
smallint
-
string
-
timestamp
-
varchar
AWS Clean Rooms tidak mendukung:
-
biner
-
interval
Jenis kompresi file untuk AWS Clean Rooms
Untuk mengurangi ruang penyimpanan, meningkatkan kinerja, dan meminimalkan biaya, kami sangat menyarankan Anda untuk mengompres kumpulan data Anda.
AWS Clean Rooms mengenali jenis kompresi file berdasarkan ekstensi file dan mendukung jenis kompresi dan ekstensi yang ditunjukkan pada tabel berikut.
Algoritma kompresi | Ekstensi file |
---|---|
GZIP | .gz |
Bzip2 | .bz2 |
Snappy | .snappy |
Anda dapat menerapkan kompresi pada level yang berbeda. Paling umum, Anda mengompres seluruh file atau mengompres blok individual dalam file. Mengompresi format kolumnar pada tingkat file tidak menghasilkan manfaat kinerja.
Enkripsi sisi server untuk AWS Clean Rooms
catatan
Enkripsi sisi server tidak menggantikan komputasi kriptografi untuk kasus penggunaan yang memerlukannya.
AWS Clean Rooms secara transparan mendekripsi kumpulan data yang dienkripsi menggunakan opsi enkripsi berikut:
-
SSE-S3 - Enkripsi sisi server menggunakan kunci enkripsi AES-256 yang dikelola oleh Amazon S3
-
SSE-KMS - Enkripsi sisi server dengan kunci yang dikelola oleh AWS Key Management Service
Untuk menggunakan SSE-S3, peran AWS Clean Rooms layanan yang digunakan untuk mengaitkan tabel yang dikonfigurasi ke kolaborasi harus memiliki izin dekripsi KMS. Untuk menggunakan SSE-KMS, kebijakan kunci KMS juga harus mengizinkan peran AWS Clean Rooms layanan untuk mendekripsi.
AWS Clean Rooms tidak mendukung enkripsi sisi klien Amazon S3. Untuk informasi selengkapnya tentang enkripsi sisi server, lihat Melindungi data menggunakan enkripsi sisi server di Panduan Pengguna Layanan Penyimpanan Sederhana Amazon.