Classes e formatos de armazenamento suportados pelo Amazon Macie - Amazon Macie

As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.

Classes e formatos de armazenamento suportados pelo Amazon Macie

Para ajudá-lo a descobrir dados confidenciais em seu conjunto de dados do Amazon Simple Storage Service (Amazon S3), o Amazon Macie oferece suporte à maioria das classes de armazenamento do Amazon S3 e a uma grande variedade de formatos de arquivo e armazenamento. Essa compatibilidade se aplica ao uso de identificadores de dados gerenciados e ao uso de identificadores de dados personalizados para analisar objetos do S3.

Para que o Macie analise um objeto do S3, o objeto precisa estar armazenado diretamente no bucket de uso geral do Amazon S3 usando uma classe de armazenamento compatível. O objeto também precisa usar um formato de arquivo ou armazenamento compatível. Os tópicos desta seção listam as classes de armazenamento e os formatos de arquivo e armazenamento que o Macie suporta atualmente.

dica

Embora o Macie seja otimizado para o Amazon S3, você pode usá-lo para descobrir dados confidenciais em recursos que você atualmente armazena em outro lugar. Você pode fazer isso movendo os dados para o Amazon S3 temporariamente ou permanentemente. Por exemplo, exporte os snapshots do Serviço do banco de dados relacional Amazon ou do Amazon Aurora para o Amazon S3 no formato Apache Parquet. Ou exporte uma tabela do Amazon DynamoDB para o Amazon S3. Em seguida, você pode criar um trabalho confidencial de descoberta de dados para analisar os dados no Amazon S3.

Classes de armazenamento do Amazon S3 compatíveis

Para a descoberta de dados confidenciais, o Amazon Macie oferece suporte às seguintes classes de armazenamento do Amazon S3:

  • Redundância reduzida (RRS)

  • S3 Glacier Instant Retrieval

  • S3 Intelligent-Tiering

  • S3 One Zone‐Infrequent Access (S3 One Zone‐IA)

  • S3 Standard

  • S3 Standard‐Infrequent Access (S3 Standard‐IA)

Macie não analisa objetos do S3 que usem outras classes de armazenamento do Amazon S3, como o S3 Glacier Deep Archive ou S3 Express One Zone. Além disso, o Macie não analisa objetos armazenados em buckets de diretório do S3.

Se você configurar um trabalho confidencial de descoberta de dados para analisar objetos do S3 que não usam uma classe de armazenamento compatível do Amazon S3, o Macie ignora esses objetos quando o trabalho é executado. O Macie não tenta recuperar ou analisar dados nos objetos — os objetos são tratados como objetos inclassificáveis. Um objeto inclassificável é um objeto que não usa uma classe de armazenamento compatível ou um formato de arquivo ou armazenamento compatível. O Macie analisa somente os objetos que usam uma classe de armazenamento e um arquivo ou formato de armazenamento compatível.

Da mesma forma, se você configurar o Macie para realizar a descoberta automatizada de dados confidenciais, objetos inclassificáveis não serão elegíveis para seleção e análise. O Macie seleciona somente os objetos que usam uma classe de armazenamento do Amazon S3 compatível e um arquivo ou formato de armazenamento compatível.

Para identificar buckets do S3 que armazenam objetos não classificáveis, você pode filtrar seu inventário de buckets do S3. Para cada bucket em seu inventário, há campos que relatam o número e o tamanho total de armazenamento de objetos inclassificáveis no bucket.

Para obter informações detalhadas sobre as classes de armazenamento que o Amazon S3 fornece, consulte Usando classes de armazenamento do Amazon S3 no Guia do usuário do Amazon Simple Storage Service.

Formatos de arquivo e armazenamento suportados

Quando o Amazon Macie analisa um objeto do S3, o Macie recupera a versão mais recente do objeto do Amazon S3 e, em seguida, realiza uma inspeção profunda do conteúdo do objeto. Essa inspeção leva em consideração o formato de arquivo ou armazenamento dos dados. O Macie pode analisar dados em vários formatos diferentes, incluindo formatos de compactação e arquivamento comumente usados.

Quando o Macie analisa dados em um arquivo compactado ou arquivado, o Macie inspeciona o arquivo completo e o conteúdo do arquivo. Para inspecionar o conteúdo do arquivo, o Macie descompacta o arquivo e, em seguida, inspeciona cada arquivo extraído que usa um formato compatível. O Macie pode fazer isso para até 1.000.000 de arquivos e até uma profundidade aninhada de 10 níveis. Para obter informações sobre cotas adicionais que se aplicam à descoberta de dados confidenciais, consulte Cotas do Amazon Macie.

A tabela a seguir lista e descreve os tipos de arquivos e formatos de armazenamento que o Macie pode analisar para detectar dados confidenciais. Para cada tipo suportado, a tabela também lista as extensões de nome de arquivo aplicáveis.

Tipo de arquivo ou armazenamento Descrição Extensões de nome de arquivo

Big data

Contêineres de objetos Apache Avro e arquivos Apache Parquet

.avro, .parquet

compactação ou arquivamento

Arquivos compactados GNU Zip, arquivos TAR e arquivos compactados ZIP

.gz, .gzip, .tar, .zip

Documento

Arquivos em formato de documento portátil da Adobe, pastas de trabalho do Microsoft Excel e documentos do Microsoft Word

.doc, .docx, .pdf, .xls, .xlsx

Mensagem de e-mail

Arquivos de correio eletrônico cujo conteúdo está em conformidade com os requisitos especificados por uma RFC da IETF para mensagens de correio eletrônico, como a RFC 2822

.eml

Texto

Arquivos de texto não binários, como arquivos de valores separados por vírgula (CSV), arquivos HTML (Hypertext Markup Language), arquivos de notação de JavaScript objetos (JSON), arquivos de linhas JSON, documentos de texto sem formatação, arquivos de valores separados por tabulação (TSV) e arquivos XML (Extensible Markup Language)

.csv, .htm, .html, .json, .jsonl, .tsv, .txt, .xml e outros (dependendo do tipo de arquivo de texto não binário)

O Macie não analisa dados em imagens, áudio, vídeo e outros tipos de conteúdo multimídia.

Se você configurar um trabalho de descoberta de dados confidenciais para analisar objetos do S3 que não usam uma classe de armazenamento compatível do Amazon S3, o Macie ignora esses objetos quando o trabalho é executado. O Macie não tenta recuperar ou analisar dados nos objetos — os objetos são tratados como objetos inclassificáveis. Um objeto inclassificável é um objeto que não usa uma classe de armazenamento compatível do Amazon S3 ou um formato de arquivo ou armazenamento compatível. O Macie analisa somente os objetos que usam uma classe de armazenamento e um arquivo ou formato de armazenamento compatível.

Da mesma forma, se você configurar o Macie para realizar a descoberta automatizada de dados confidenciais, objetos inclassificáveis não serão elegíveis para seleção e análise. O Macie seleciona somente os objetos que usam uma classe de armazenamento do Amazon S3 compatível e um arquivo ou formato de armazenamento compatível.

Para identificar buckets do S3 que armazenam objetos não classificáveis, você pode filtrar seu inventário de buckets do S3. Para cada bucket em seu inventário, há campos que relatam o número e o tamanho total de armazenamento de objetos inclassificáveis no bucket.