Kelas dan format penyimpanan yang didukung oleh Amazon Macie - Amazon Macie

Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.

Kelas dan format penyimpanan yang didukung oleh Amazon Macie

Untuk membantu Anda menemukan data sensitif di kawasan data Amazon Simple Storage Service (Amazon S3), Amazon Macie mendukung sebagian besar kelas penyimpanan Amazon S3 dan berbagai format file dan penyimpanan. Dukungan ini berlaku untuk penggunaan pengidentifikasi data terkelola dan penggunaan pengidentifikasi data khusus untuk menganalisis objek S3.

Agar Macie dapat menganalisis objek S3, objek harus disimpan dalam bucket tujuan umum Amazon S3 menggunakan kelas penyimpanan yang didukung. Objek juga harus menggunakan file atau format penyimpanan yang didukung. Topik di bagian ini mencantumkan kelas penyimpanan dan format file dan penyimpanan yang saat ini didukung Macie.

Tip

Meskipun Macie dioptimalkan untuk Amazon S3, Anda dapat menggunakannya untuk menemukan data sensitif dalam sumber daya yang saat ini Anda simpan di tempat lain. Anda dapat melakukan ini dengan memindahkan data ke Amazon S3 sementara atau permanen. Misalnya, ekspor Amazon Relational Database Service atau snapshot Amazon Aurora ke Amazon S3 dalam format Apache Parquet. Atau ekspor tabel Amazon DynamoDB ke Amazon S3. Anda kemudian dapat membuat pekerjaan penemuan data sensitif untuk menganalisis data di Amazon S3.

Kelas penyimpanan Amazon S3 yang didukung

Untuk penemuan data sensitif, Amazon Macie mendukung kelas penyimpanan Amazon S3 berikut:

  • Redundansi Berkurang (RRS)

  • S3 Glacier Instant Retrieval

  • Tingkat Cerdas S3

  • S3 Satu Zona ‐ Akses Jarang (S3 Satu Zona ‐ Ia)

  • S3 Standard

  • Akses Standar S3-Jarang (Standar S3-IA)

Macie tidak menganalisis objek S3 yang menggunakan kelas penyimpanan Amazon S3 lainnya, seperti S3 Glacier Deep Archive atau S3 Express One Zone. Selain itu, Macie tidak menganalisis objek yang disimpan dalam bucket direktori S3.

Jika Anda mengonfigurasi tugas penemuan data sensitif untuk menganalisis objek S3 yang tidak menggunakan kelas penyimpanan Amazon S3 yang didukung, Macie melewatkan objek tersebut saat pekerjaan berjalan. Macie tidak mencoba untuk mengambil atau menganalisis data dalam objek — objek diperlakukan sebagai objek yang tidak dapat diklasifikasikan. Objek yang tidak dapat diklasifikasikan adalah objek yang tidak menggunakan kelas penyimpanan yang didukung atau file atau format penyimpanan yang didukung. Macie hanya menganalisis objek yang menggunakan kelas penyimpanan yang didukung dan file atau format penyimpanan yang didukung.

Demikian pula, jika Anda mengonfigurasi Macie untuk melakukan penemuan data sensitif otomatis, objek yang tidak dapat diklasifikasikan tidak memenuhi syarat untuk dipilih dan dianalisis. Macie hanya memilih objek yang menggunakan kelas penyimpanan Amazon S3 yang didukung dan format file atau penyimpanan yang didukung.

Untuk mengidentifikasi bucket S3 yang menyimpan objek yang tidak dapat diklasifikasikan, Anda dapat memfilter inventaris bucket S3 Anda. Untuk setiap bucket dalam inventaris Anda, ada kolom yang melaporkan jumlah dan ukuran penyimpanan total objek yang tidak dapat diklasifikasikan dalam bucket.

Untuk informasi terperinci tentang kelas penyimpanan yang disediakan Amazon S3, lihat Menggunakan kelas penyimpanan Amazon S3 di Panduan Pengguna Layanan Penyimpanan Sederhana Amazon.

Format file dan penyimpanan yang didukung

Saat Amazon Macie menganalisis objek S3, Macie mengambil versi terbaru objek dari Amazon S3, dan kemudian melakukan pemeriksaan mendalam terhadap konten objek. Pemeriksaan ini memperhitungkan format file atau penyimpanan data. Macie dapat menganalisis data dalam berbagai format, termasuk format kompresi dan arsip yang umum digunakan.

Ketika Macie menganalisis data dalam file terkompresi atau arsip, Macie memeriksa file lengkap dan isi file. Untuk memeriksa isi file, Macie mendekompresi file, lalu memeriksa setiap file yang diekstraksi menggunakan format yang didukung. Macie dapat melakukan hal ini sebanyak 1.000.000 file dan hingga kedalaman bersarang 10 tingkat. Untuk informasi tentang kuota tambahan yang berlaku untuk penemuan data sensitif, lihatKuota Amazon Macie.

Tabel berikut mencantumkan dan menjelaskan jenis file dan format penyimpanan yang dapat dianalisis Macie untuk mendeteksi data sensitif. Untuk setiap jenis yang didukung, tabel juga mencantumkan ekstensi nama file yang berlaku.

Jenis file atau penyimpanan Deskripsi Ekstensi nama file

Big data

Objek kontainer Apache Avro dan file Apache Parket

.avro, .parquet

Kompresi atau arsip

Arsip terkompresi GNU Zip, arsip TAR, dan arsip terkompresi ZIP

.gz, .gzip, .tar, .zip

Dokumen

File Adobe Portable Document Format, buku kerja Microsoft Excel, dan dokumen Microsoft Word

.doc, .docx, .pdf, .xls, .xlsx

Pesan email

File surat elektronik yang isinya memenuhi persyaratan yang ditentukan oleh IETF RFC untuk pesan surat elektronik, seperti RFC 2822

.eml

Teks

File teks non-biner seperti file nilai yang dipisahkan koma (CSV), file Hypertext Markup Language (HTML), file JavaScript Object Notation (JSON), file JSON Lines, dokumen teks biasa, file nilai yang dipisahkan tab (TSV), dan file Extensible Markup Language (XHTML)

.csv, .htm, .html, .json, .jsonl, .tsv, .txt, .xml, dan yang lainnya (tergantung pada tipe file teks non-biner)

Macie tidak menganalisis data dalam gambar, atau audio, video, dan jenis konten multimedia lainnya.

Jika Anda mengonfigurasi pekerjaan penemuan data sensitif untuk menganalisis objek S3 yang tidak menggunakan file atau format penyimpanan yang didukung, Macie melewatkan objek tersebut saat pekerjaan berjalan. Macie tidak mencoba untuk mengambil atau menganalisis data dalam objek — objek diperlakukan sebagai objek yang tidak dapat diklasifikasikan. Objek yang tidak dapat diklasifikasikan adalah objek yang tidak menggunakan kelas penyimpanan Amazon S3 yang didukung atau format file atau penyimpanan yang didukung. Macie hanya menganalisis objek yang menggunakan kelas penyimpanan yang didukung dan file atau format penyimpanan yang didukung.

Demikian pula, jika Anda mengonfigurasi Macie untuk melakukan penemuan data sensitif otomatis, objek yang tidak dapat diklasifikasikan tidak memenuhi syarat untuk dipilih dan dianalisis. Macie hanya memilih objek yang menggunakan kelas penyimpanan Amazon S3 yang didukung dan format file atau penyimpanan yang didukung.

Untuk mengidentifikasi bucket S3 yang menyimpan objek yang tidak dapat diklasifikasikan, Anda dapat memfilter inventaris bucket S3 Anda. Untuk setiap bucket dalam inventaris Anda, ada kolom yang melaporkan jumlah dan ukuran penyimpanan total objek yang tidak dapat diklasifikasikan dalam bucket.