Formati di dati per AWS Clean Rooms - AWS Clean Rooms

Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.

Formati di dati per AWS Clean Rooms

I set di dati utilizzati per le query AWS Clean Rooms sono in genere gli stessi tipi di set di dati utilizzati per altre applicazioni. Ad esempio, gli stessi tipi di set di dati vengono utilizzati con Amazon Athena, Amazon EMR, Amazon Redshift Spectrum e Amazon. QuickSight Puoi interrogare i dati nel formato originale direttamente da Amazon Simple Storage Service (Amazon S3).

Per interrogare i dati, i set di dati devono essere in un formato che AWS Clean Rooms supporti. Il bucket Amazon S3 con i set di dati e il AWS Clean Rooms cluster deve trovarsi nello stesso. Regione AWS

Formati di dati supportati

AWS Clean Rooms supporta i seguenti formati strutturati:

Nota

Un timestamp valore in un file di testo deve essere nel formato. yyyy-MM-dd HH:mm:ss.SSSSSS Ad esempio:2017-05-01 11:30:59.000000.

Ti consigliamo di utilizzare un formato di file di archiviazione a colonne, ad esempio. Apache Parquet Con un formato di questo tipo, è possibile ridurre al minimo il trasferimento di dati al di fuori di Amazon S3 selezionando solo le colonne necessarie. Per prestazioni ottimali, gli oggetti di grandi dimensioni devono essere suddivisi in oggetti da 100 MB a 1 GB.

Tipi di dati supportati

Per un'esperienza ottimale con AWS Clean Rooms, tutti i dati devono essere catalogati in. AWS Glue Per ulteriori informazioni, consulta la sezione intitolata Guida introduttiva alla Guida per AWS Glue Data Catalog gli AWS Glue sviluppatori.

AWS Clean Rooms supporta i seguenti tipi di AWS Glue Data Catalog dati:

  • bigint

  • boolean

  • char

  • date

  • decimal

  • double

  • float

  • int

  • Tipi di dati annidati come:

    • array

    • map

    • struct

  • smallint

  • string

  • timestamp

  • varchar

AWS Clean Rooms non supporta:

  • binary

  • intervallo

tipi di compressione dei file per AWS Clean Rooms

Per ridurre lo spazio di archiviazione, migliorare le prestazioni e ridurre al minimo i costi, consigliamo vivamente di comprimere i set di dati.

AWS Clean Rooms riconosce i tipi di compressione dei file in base all'estensione del file e supporta i tipi e le estensioni di compressione mostrati nella tabella seguente.

Algoritmo di compressione Estensione di file
GZIP .gz
Bzip2 .bz2
Snappy .snappy

Puoi applicare la compressione a diversi livelli. Più comunemente, comprimi un intero file o comprimi singoli blocchi all'interno di un file. La compressione dei formati colonnari a livello di file non offre vantaggi in termini di prestazioni.

Crittografia lato server per AWS Clean Rooms

Nota

La crittografia lato server non sostituisce l'elaborazione crittografica per i casi d'uso che la richiedono.

AWS Clean Rooms decrittografa in modo trasparente i set di dati crittografati utilizzando le seguenti opzioni di crittografia:

  • SSE-S3: crittografia lato server con una chiave di crittografia AES-256 gestita da Amazon S3

  • SSE-KMS: crittografia lato server con chiavi gestite da AWS Key Management Service

Per utilizzare SSE-S3, il ruolo di AWS Clean Rooms servizio utilizzato per associare la tabella configurata alla collaborazione deve disporre delle autorizzazioni KMS-Decrypt. Per utilizzare SSE-KMS, la politica delle chiavi KMS deve consentire anche la decrittografia del ruolo di servizio. AWS Clean Rooms

AWS Clean Rooms non supporta la crittografia lato client di Amazon S3. Per ulteriori informazioni sulla crittografia lato server, consulta Protezione dei dati utilizzando la crittografia lato server nella Guida per l'utente di Amazon Simple Storage Service.