Clases y formatos de almacenamiento compatibles con Amazon Macie - Amazon Macie

Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.

Clases y formatos de almacenamiento compatibles con Amazon Macie

Para ayudarle a detectar datos confidenciales en su patrimonio de datos de Amazon Simple Storage Service (Amazon S3), Amazon Macie es compatible con la mayoría de las clases de almacenamiento de Amazon S3 y con una amplia variedad de formatos de archivos y almacenamiento. Esta compatibilidad se aplica al uso de identificadores de datos administrados y al uso de identificadores de datos personalizados para analizar objetos de S3.

Para que Macie analice un objeto de S3, el objeto debe almacenarse en un bucket de uso general de Amazon S3 mediante una clase de almacenamiento compatible. El objeto también debe utilizar un archivo o un formato de almacenamiento compatible. En los temas de esta sección se enumeran las clases de almacenamiento y los formatos de archivo y almacenamiento que Macie admite actualmente.

sugerencia

Aunque Macie está optimizado para Amazon S3, puede usarlo para detectar datos confidenciales en recursos que actualmente almacena en otros lugares. Para ello, puede mover los datos a Amazon S3 de forma temporal o permanente. Por ejemplo, exporte instantáneas Amazon Relational Database Service o Amazon Aurora a Amazon S3 en formato Apache Parquet. O exporte una tabla de Amazon DynamoDB a Amazon S3. A continuación, puede crear un trabajo de detección de datos confidenciales para analizar los datos en Amazon S3.

Clases de almacenamiento compatbles de Amazon S3

Para la detección de datos confidenciales, Amazon Macie admite las siguientes clases de almacenamiento de Amazon S3:

  • Redundancia reducida (RRS)

  • S3 Glacier Instant Retrieval

  • S3 Intelligent-Tiering

  • S3 One Zone‐Infrequent Access (S3 One Zone‐IA)

  • S3 Standard

  • S3 Standard‐Infrequent Access (S3 Standard‐IA)

Macie no analiza objetos de S3 que utilizan otras clases de almacenamiento de Amazon S3, como S3 Glacier Deep Archive o S3 Express One Zone. Además, Macie no analiza los objetos que están almacenados en los buckets de directorio de Amazon S3.

Si configura un trabajo de detección de datos confidenciales para analizar objetos de S3 que no utilizan una clase de almacenamiento de Amazon S3 compatible, Macie omite esos objetos cuando se ejecuta el trabajo. Macie no intenta extraer ni analizar los datos de los objetos: los trata como objetos no clasificables. Un objeto no clasificables es un objeto que no utiliza una clase de almacenamiento de compatible o un archivo o formato de almacenamiento compatible. Macie analiza solo aquellos objetos que utilizan una clase, archivo o formato de almacenamiento compatibles.

Igualmente, si se configura Macie para que realice la detección automática de datos confidenciales, los objetos no clasificables no podrán seleccionarse ni analizarse. Macie selecciona solo los objetos que utilizan una clase de almacenamiento Amazon S3, un archivo o formato de almacenamiento compatibles.

Para identificar los buckets de S3 que contienen objetos no clasificables, se puede filtrar el inventario de bucket de S3. Para cada bucket del inventario, hay campos que indican el número y el tamaño total de almacenamiento de los objetos no clasificables del depósito.

Para obtener información detallada sobre las clases de almacenamiento que ofrece Amazon S3, consulte Uso de las clases de almacenamiento de Amazon S3 en la Guía del usuario de Amazon Simple Storage Service.

Formatos de archivo y almacenamiento compatibles

Cuando Amazon Macie analiza un objeto de S3, recupera la última versión del objeto de Amazon S3 y luego realiza una inspección profunda de los contenidos del objeto. Esta inspección tiene en cuenta el formato de archivo o almacenamiento de los datos. Macie puede analizar los datos en muchos formatos diferentes, incluidos los formatos de compresión y archivo más utilizados.

Cuando Macie analiza los datos de un archivo comprimido o archivado, Macie inspecciona tanto el archivo completo como su contenido. Para revisar el contenido del archivo, Macie los descomprime y, a continuación, inspecciona cada archivo extraído que utiliza un formato compatible. Macie puede hacer esto para un máximo de 1 000 000 de archivos y hasta una profundidad anidada de 10 niveles. Para obtener información sobre las cuotas adicionales que se aplican a la detección de datos confidenciales, consulte Cuotas de Amazon Macie.

En la siguiente tabla se enumeran y describen los tipos de archivos y formatos de almacenamiento que Macie puede analizar para detectar datos confidenciales. Para cada tipo compatible, la tabla también muestra las extensiones de nombre de archivo aplicables.

Tipo de archivo o almacenamiento Descripción Extensiones de nombre de archivo

Big data

Contenedores de objetos Apache Avro y archivos de Apache Parquet

.avro, .parquet

Compresión o archivo

Archivos comprimidos GNU Zip, TAR y ZIP

.gz, .gzip, .tar, .zip

Documento

Archivos de formato de documento portátil de Adobe, libros de trabajo de Microsoft Excel y documentos de Microsoft Word

.doc, .docx, .pdf, .xls, .xlsx

Mensaje de correo electrónico

Archivos de correo electrónico cuyo contenido cumpla los requisitos especificados en una RFC del IETF para los mensajes de correo electrónico, como la RFC 2822

.eml

Texto

Archivos de texto no binarios, como archivos de valores separados por comas (CSV), archivos de lenguaje de marcado de hipertexto (HTML), archivos de notación de objetos JavaScript (JSON), archivos de líneas JSON, documentos de texto sin formato, archivos de valores separados por tabulaciones (TSV) y archivos de lenguaje de marcado extensible (XML)

.csv, .htm, .html, .json, .jsonl, .tsv, .txt, .xml y otros (según el tipo de archivo de texto no binario)

Macie no analiza los datos de las imágenes ni del audio, el vídeo ni otros tipos de contenido multimedia.

Si configura un trabajo de detección de datos confidenciales para analizar los objetos de S3 que no utilizan un formato de archivo o almacenamiento compatible, Macie omite esos objetos cuando se ejecuta el trabajo. Macie no intenta extraer ni analizar los datos de los objetos: los trata como objetos no clasificables. Un objeto no clasificable es un objeto que no utiliza una clase de almacenamiento de Amazon S3 compatible ni un archivo o formato de almacenamiento compatible. Macie analiza solo aquellos objetos que utilizan una clase, archivo o formato de almacenamiento compatibles.

Igualmente, si se configura Macie para que realice la detección automática de datos confidenciales, los objetos no clasificables no podrán seleccionarse ni analizarse. Macie selecciona solo los objetos que utilizan una clase de almacenamiento Amazon S3, un archivo o formato de almacenamiento compatibles.

Para identificar los buckets de S3 que contienen objetos no clasificables, se puede filtrar el inventario de bucket de S3. Para cada bucket del inventario, hay campos que indican el número y el tamaño total de almacenamiento de los objetos no clasificables del depósito.