Formatos de dados para AWS Clean Rooms - AWS Clean Rooms

As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.

Formatos de dados para AWS Clean Rooms

Para consultar dados, os conjuntos de dados devem estar em um formato AWS Clean Rooms compatível. O bucket do Amazon S3 com os conjuntos de dados e o AWS Clean Rooms cluster deve estar no mesmo. Região da AWS

Formatos de dados suportados

AWS Clean Rooms suporta os seguintes formatos estruturados:

nota

Um timestamp valor em um arquivo de texto deve estar no formato yyyy-MM-dd HH:mm:ss.SSSSSS. Por exemplo: 2017-05-01 11:30:59.000000.

Recomendamos usar um formato de arquivo de armazenamento colunar, como Apache Parquet. Com um formato de arquivo colunar para o armazenamento, é possível minimizar a transferência de dados do Amazon S3 selecionando apenas as colunas necessárias. Para um desempenho ideal, objetos grandes devem ser divididos em objetos de 100 MB a 1 GB.

Tipos de dados compatíveis

Para uma experiência ideal com AWS Clean Rooms, todos os seus dados devem ser catalogados em AWS Glue. Para obter mais informações, consulte a seção intitulada Introdução ao AWS Glue Data Catalog no Guia do desenvolvedor do AWS Glue .

AWS Clean Rooms suporta os seguintes tipos de AWS Glue Data Catalog dados:

  • bigint

  • boolean

  • char

  • date

  • decimal

  • double

  • float

  • int

  • Tipos de dados aninhados, como:

    • array

    • map

    • struct

  • smallint

  • string

  • timestamp

  • varchar

AWS Clean Rooms não suporta:

  • binary

  • interval

Tipos de compactação de arquivos para AWS Clean Rooms

Para reduzir o espaço de armazenamento, melhorar o desempenho e minimizar custos, recomendamos fortemente que você compacte seus conjuntos de dados.

AWS Clean Rooms reconhece os tipos de compactação de arquivos com base na extensão do arquivo e oferece suporte aos tipos e extensões de compactação mostrados na tabela a seguir.

Algoritmo de compactação Extensão de arquivo
GZIP .gz
Bzip2 .bz2
Snappy .snappy

Você pode aplicar compactação em diferentes níveis. O mais comum é compactar um arquivo inteiro ou blocos individuais dentro de um arquivo. A compactação de formatos colunares no nível do arquivo não traz benefícios de desempenho.

Criptografia do lado do servidor para AWS Clean Rooms

nota

A criptografia do lado do servidor não substitui a computação criptográfica para os casos de uso que a exigem.

AWS Clean Rooms descriptografa de forma transparente conjuntos de dados que são criptografados usando as seguintes opções de criptografia:

  • SSE-S3 — Criptografia do lado do servidor usando uma chave de criptografia AES -256 gerenciada pelo Amazon S3

  • SSE- KMS — Criptografia do lado do servidor com chaves gerenciadas por AWS Key Management Service

Para usar SSE -S3, a função de AWS Clean Rooms serviço usada para associar a tabela configurada à colaboração deve ter permissões KMS -decrypt. Para usar SSE -KMS, a política de KMS chaves também deve permitir que a função AWS Clean Rooms de serviço seja descriptografada.

AWS Clean Rooms não oferece suporte à criptografia do lado do cliente do Amazon S3. Para obter mais informações sobre criptografia no lado do servidor, consulte Proteger dados usando criptografia no lado do servidor no Guia do usuário do Amazon Simple Storage Service.