Format data untuk AWS Clean Rooms - AWS Clean Rooms

Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.

Format data untuk AWS Clean Rooms

Kumpulan data yang Anda gunakan untuk kueri biasanya AWS Clean Rooms adalah jenis kumpulan data yang sama yang Anda gunakan untuk aplikasi lain. Misalnya, jenis kumpulan data yang sama digunakan dengan Amazon Athena, Amazon EMR, Amazon Redshift Spectrum, dan Amazon. QuickSight Anda dapat menanyakan data dalam format aslinya langsung dari Amazon Simple Storage Service (Amazon S3).

Untuk kueri data, kumpulan data harus dalam format yang AWS Clean Rooms mendukung. Bucket Amazon S3 dengan kumpulan data dan AWS Clean Rooms cluster harus sama. Wilayah AWS

Format data yang didukung

AWS Clean Rooms mendukung format terstruktur berikut:

catatan

timestampNilai dalam file teks harus dalam formatyyyy-MM-dd HH:mm:ss.SSSSSS. Misalnya:2017-05-01 11:30:59.000000.

Sebaiknya gunakan format file penyimpanan kolumnar, seperti. Apache Parquet Dengan format file penyimpanan kolumnar, Anda dapat meminimalkan transfer data dari Amazon S3 dengan memilih hanya kolom yang Anda butuhkan. Untuk kinerja optimal, objek besar harus dibagi menjadi objek 100mb—1gb.

Jenis data yang didukung

Untuk pengalaman yang optimal AWS Clean Rooms, semua data Anda harus dikatalogkan. AWS Glue Untuk informasi selengkapnya, lihat bagian berjudul Memulai dengan AWS Glue Data Catalog di Panduan AWS Glue Pengembang.

AWS Clean Rooms mendukung tipe AWS Glue Data Catalog data berikut:

  • bigint

  • boolean

  • char

  • date

  • decimal

  • double

  • float

  • int

  • Tipe data bersarang seperti:

    • array

    • map

    • struct

  • smallint

  • string

  • timestamp

  • varchar

AWS Clean Rooms tidak mendukung:

  • biner

  • interval

Jenis kompresi file untuk AWS Clean Rooms

Untuk mengurangi ruang penyimpanan, meningkatkan kinerja, dan meminimalkan biaya, kami sangat menyarankan Anda untuk mengompres kumpulan data Anda.

AWS Clean Rooms mengenali jenis kompresi file berdasarkan ekstensi file dan mendukung jenis kompresi dan ekstensi yang ditunjukkan pada tabel berikut.

Algoritma kompresi Ekstensi file
GZIP .gz
Bzip2 .bz2
Snappy .snappy

Anda dapat menerapkan kompresi pada level yang berbeda. Paling umum, Anda mengompres seluruh file atau mengompres blok individual dalam file. Mengompresi format kolumnar pada tingkat file tidak menghasilkan manfaat kinerja.

Enkripsi sisi server untuk AWS Clean Rooms

catatan

Enkripsi sisi server tidak menggantikan komputasi kriptografi untuk kasus penggunaan yang memerlukannya.

AWS Clean Rooms secara transparan mendekripsi kumpulan data yang dienkripsi menggunakan opsi enkripsi berikut:

  • SSE-S3 - Enkripsi sisi server menggunakan kunci enkripsi AES-256 yang dikelola oleh Amazon S3

  • SSE-KMS - Enkripsi sisi server dengan kunci yang dikelola oleh AWS Key Management Service

Untuk menggunakan SSE-S3, peran AWS Clean Rooms layanan yang digunakan untuk mengaitkan tabel yang dikonfigurasi ke kolaborasi harus memiliki izin dekripsi KMS. Untuk menggunakan SSE-KMS, kebijakan kunci KMS juga harus mengizinkan peran AWS Clean Rooms layanan untuk mendekripsi.

AWS Clean Rooms tidak mendukung enkripsi sisi klien Amazon S3. Untuk informasi selengkapnya tentang enkripsi sisi server, lihat Melindungi data menggunakan enkripsi sisi server di Panduan Pengguna Layanan Penyimpanan Sederhana Amazon.