Skema JSON untuk lokasi data sensitif - Amazon Macie

Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.

Skema JSON untuk lokasi data sensitif

Amazon Macie menggunakan struktur JSON standar untuk menyimpan informasi tentang tempat ia menemukan data sensitif di objek Amazon Simple Storage Service (Amazon S3). Struktur digunakan oleh temuan data sensitif dan hasil penemuan data sensitif. Untuk temuan data sensitif, struktur adalah bagian dari skema JSON untuk temuan. Untuk meninjau skema JSON lengkap untuk temuan, lihat Temuan di Referensi API Amazon Macie. Untuk mempelajari selengkapnya tentang hasil penemuan data sensitif, lihat Menyimpan dan mempertahankan hasil penemuan data sensitif.

Ikhtisar skema JSON untuk lokasi data sensitif

Untuk melaporkan lokasi data sensitif yang ditemukan Amazon Macie di objek S3 yang terpengaruh, skema JSON untuk temuan data sensitif dan hasil penemuan data sensitif mencakup satu objek dan satu customDataIdentifiers objek. sensitiveData customDataIdentifiersObjek memberikan rincian tentang data yang Macie terdeteksi menggunakan pengidentifikasi data kustom. sensitiveDataObjek memberikan rincian tentang data yang Macie terdeteksi menggunakan pengidentifikasi data yang dikelola.

Setiap objek customDataIdentifiers dan sensitiveData berisi satu arraydetections atau lebih:

  • Dalam sebuah customDataIdentifiers objek, detections array menunjukkan pengidentifikasi data kustom mana yang mendeteksi data dan menghasilkan temuan. Untuk setiap pengidentifikasi data kustom, array juga menunjukkan jumlah kejadian data yang dideteksi pengidentifikasi. Array tersebut juga dapat menunjukkan lokasi data yang terdeteksi oleh pengenal.

  • Pada objek sensitiveData, array detections yang menunjukkan tipe data sensitif yang Macie deteksi menggunakan pengidentifikasi data terkelola. Untuk setiap tipe data sensitif, array juga menunjukkan jumlah kejadian dari data, dan dapat menunjukkan lokasi data.

Untuk temuan data sensitif, array detections dapat mencakup 1-15 objek occurrences. Setiap occurrences objek menentukan di mana Macie mendeteksi kejadian individu dari jenis data sensitif tertentu.

Misalnya, detections larik berikut menunjukkan lokasi tiga kejadian data sensitif (nomor Jaminan Sosial AS) yang ditemukan Macie dalam file CSV.

"sensitiveData": [ { "category": "PERSONAL_INFORMATION", "detections": [ { "count": 30, "occurrences": { "cells": [ { "cellReference": null, "column": 1, "columnName": "SSN", "row": 2 }, { "cellReference": null, "column": 1, "columnName": "SSN", "row": 3 }, { "cellReference": null, "column": 1, "columnName": "SSN", "row": 4 } ] }, "type": "USA_SOCIAL_SECURITY_NUMBER" }

Lokasi dan jumlah occurrences objek dalam detections array bervariasi berdasarkan kategori, jenis, dan jumlah kejadian data sensitif yang dideteksi Macie selama siklus analisis penemuan data sensitif otomatis atau menjalankan pekerjaan penemuan data sensitif. Untuk setiap siklus analisis atau pekerjaan yang dijalankan, Macie menggunakan algoritma penelusuran kedalaman pertama untuk mengisi temuan yang dihasilkan dengan data lokasi selama 1—15 kejadian data sensitif yang dideteksi Macie di objek S3. Kejadian ini menunjukkan kategori dan jenis data sensitif yang mungkin berisi bucket dan objek S3 yang terpengaruh.

occurrencesObjek dapat berisi struktur berikut, tergantung pada jenis file atau format penyimpanan objek S3 yang terpengaruh:

  • Array cells - Array ini berlaku untuk buku kerja Microsoft Excel, file CSV, dan file TSV. Objek dalam array ini menentukan sel atau bidang yang Macie mendeteksi terjadinya data sensitif di.

  • lineRangesarray - Array ini berlaku untuk pesan email (EML) file, dan file teks non-biner selain CSV, JSON, JSON Lines, dan file TSV — misalnya, HTML, TXT, dan file XML—misalnya, HTML, TXT, dan XML-file. Objek dalam array ini menentukan garis atau rentang garis inklusif yang Macie mendeteksi terjadinya data sensitif, dan posisi data pada garis atau garis yang ditentukan.

    Dalam kasus tertentu, objek dalam lineRanges array menentukan lokasi deteksi data sensitif dalam jenis file atau format penyimpanan yang didukung oleh jenis lain dari array. Kasus-kasus tersebut adalah: deteksi di bagian tidak terstruktur dari file yang terstruktur lain, seperti komentar dalam file; deteksi dalam file cacat yang dianalisis Macie sebagai plaintext; dan, file CSV atau TSV yang memiliki satu atau lebih nama kolom tempat Macie mendeteksi data sensitif masuk.

  • Array offsetRanges - Array ini dicadangkan untuk penggunaan di waktu yang akan datang. Jika array ini hadir, nilai untuk itu adalah null.

  • Array pages - Array ini berlaku untuk file Adobe Portable Document Format (PDF). Objek dalam array ini menentukan halaman yang Macie mendeteksi terjadinya data sensitif di.

  • Array records - Array ini berlaku untuk kontainer objek Apache Avro, file Apache Parket, file JSON, dan file JSON Lines. Untuk Avro objek kontainer dan file Parket, objek dalam array ini menentukan indeks record dan path ke lapangan dalam catatan bahwa Macie mendeteksi terjadinya data sensitif di. Untuk file JSON dan JSON Lines, objek dalam array ini menentukan jalur ke bidang atau array yang Macie mendeteksi terjadinya data sensitif di. Untuk file JSON Lines, hal itu juga menentukan indeks dari baris yang berisi data.

Isi dari susunan ini bervariasi berdasarkan tipe file atau format penyimpanan objek S3 terpengaruh dan isinya.

Rincian skema JSON dan contoh untuk lokasi data sensitif

Amazon Macie menyesuaikan konten struktur JSON yang digunakannya untuk menunjukkan di mana ia mendeteksi data sensitif dalam jenis file dan konten tertentu. Topik berikut menjelaskan dan memberikan contoh struktur ini.

Untuk daftar lengkap struktur JSON yang dapat disertakan dalam temuan data sensitif, lihat Temuan di Referensi API Amazon Macie.

Cell array

Berlaku untuk: Buku kerja Microsoft Excel, file CSV, dan file TSV

Dalam cells array, Cell objek menentukan sel atau bidang yang Macie mendeteksi terjadinya data sensitif di. Tabel berikut menjelaskan tujuan masing-masing bidang dalam objek Cell.

Bidang Tipe Deskripsi
cellReference String Lokasi sel, sebagai referensi sel absolut, yang berisi kejadian tersebut. Bidang ini hanya berlaku untuk buku kerja Excel. Nilai ini adalah tidak berlaku untuk file CSV dan TSV.
column Bulat Jumlah kolom kolom yang berisi kejadian tersebut. Untuk buku kerja Excel, nilai ini berkorelasi dengan karakter abjad (-abjad) untuk pengidentifikasi kolom — misalnya, 1 untuk kolom A, 2untuk kolom B, dan seterusnya.
columnName String Nama kolom yang berisi kejadian, jika tersedia.
row Bulat Nomor baris baris yang berisi kejadian tersebut.

Contoh berikut menunjukkan struktur Cell objek yang menentukan lokasi terjadinya data sensitif yang Macie terdeteksi dalam file CSV.

"cells": [ { "cellReference": null, "column": 3, "columnName": "SSN", "row": 5 } ]

Dalam contoh sebelumnya, temuan menunjukkan bahwa Macie mendeteksi data sensitif di bidang di baris kelima dari kolom ketiga (bernama SSN) dari file.

Contoh berikut menunjukkan struktur Cell objek yang menentukan lokasi terjadinya data sensitif yang Macie terdeteksi dalam buku kerja Excel.

"cells": [ { "cellReference": "Sheet2!C5", "column": 3, "columnName": "SSN", "row": 5 } ]

Pada contoh sebelumnya, temuan menunjukkan bahwa Macie mendeteksi data sensitif di lembar kerja bernama Sheet2 di buku kerja. Di lembar kerja itu, Macie mendeteksi data sensitif di sel di baris kelima kolom ketiga (kolom C, bernama SSN).

LineRangessusunan

Berlaku untuk: Email message (EML) file, dan file teks non-biner selain CSV, JSON, JSON Lines, dan file TSV — misalnya, HTML, TXT, dan file XML—misalnya, HTML, TXT, dan XML-file

Dalam lineRanges array, Range objek menentukan garis atau rentang garis inklusif yang Macie mendeteksi terjadinya data sensitif, dan posisi data pada garis atau garis yang ditentukan.

Objek ini sering kosong demi tipe file yang didukung oleh tipe lain dari susunan di objek occurrences. Pengecualian nya adalah:

  • Data di bagian yang tidak terstruktur dari file lain yang terstruktur, seperti komentar dalam file.

  • Data dalam file cacat ketika Macie menganalisisnya sebagai plaintext.

  • File CSV atau TSV yang memiliki satu atau beberapa nama kolom tempat Macie mendeteksi data sensitif.

Tabel berikut menjelaskan tujuan masing-masing bidang dalam Objek Range dari objek susunan lineRanges.

Bidang Tipe Deskripsi
end Bulat Jumlah baris dari awal file sampai akhir kejadian.
start Bulat Jumlah baris dari awal file ke awal terjadinya.
startColumn Bulat Jumlah karakter, dengan spasi dan mulai dari 1, dari awal baris pertama yang berisi kejadian (start) hingga awal terjadinya.

Contoh berikut menunjukkan struktur Range objek yang menentukan lokasi terjadinya data sensitif yang Macie terdeteksi pada satu baris dalam file TXT.

"lineRanges": [ { "end": 1, "start": 1, "startColumn": 119 } ]

Dalam contoh sebelumnya, temuan menunjukkan bahwa Macie mendeteksi kejadian lengkap data sensitif (alamat surat) di baris pertama file. Karakter pertama dalam kejadian adalah 119 karakter (dengan spasi) dimulai dari awal baris itu.

Contoh berikut menunjukkan struktur Range objek yang menentukan lokasi terjadinya data sensitif yang mencakup beberapa baris dalam file TXT.

"lineRanges": [ { "end": 54, "start": 51, "startColumn": 1 } ]

Dalam contoh sebelumnya, temuan menunjukkan bahwa Macie mendeteksi terjadinya data sensitif (alamat surat) yang mencakup baris 51 hingga 54 file. Karakter pertama dalam kejadian merupakan karakter pertama di baris 51 dari file.

Array halaman

Berlaku untuk: File Adobe Portable Dokumen Format (PDF)

Dalam pages array, Page objek menentukan halaman yang Macie mendeteksi terjadinya data sensitif di. Objek berisi bidang pageNumber. pageNumberBidang menyimpan integer yang menentukan nomor halaman halaman yang berisi kejadian tersebut.

Contoh berikut menunjukkan struktur Page objek yang menentukan lokasi terjadinya data sensitif yang Macie terdeteksi dalam file PDF.

"pages": [ { "pageNumber": 10 } ]

Pada contoh sebelumnya, temuan menunjukkan bahwa halaman 10 file berisi kejadian tersebut.

Array catatan

Berlaku untuk: Kontainer objek Apache Avro, file Apache Parket, file JSON, dan file JSON Lines

Untuk wadah objek Avro atau file Parket, Record objek dalam records array menentukan indeks record dan path ke lapangan dalam catatan yang Macie mendeteksi terjadinya data sensitif di. Untuk file JSON dan JSON Lines, Record objek menentukan jalur ke bidang atau larik tempat Macie mendeteksi terjadinya data sensitif. Untuk file JSON Lines, itu juga menentukan indeks baris yang berisi kejadian tersebut.

Tabel berikut menjelaskan tujuan masing-masing bidang dalam objek Record.

Bidang Tipe Deskripsi
jsonPath String

Jalan, sebagai ekspresi JSONPath, untuk terjadinya.

Untuk wadah objek Avro atau file Parket, ini adalah path ke bidang dalam record (recordIndex) yang berisi terjadinya. Untuk file JSON atau JSON Lines, ini adalah path ke field atau array yang berisi kejadian tersebut. Jika data adalah nilai dalam array, jalan juga menunjukkan nilai yang berisi kejadian tersebut.

Jika Macie mendeteksi data sensitif pada nama elemen apa pun di jalur, Macie menghilangkan bidang jsonPath dari objek Record. Jika nama elemen path melebihi 240 karakter, Macie memotong nama dengan menghapus karakter dari awal nama. Jika jalur penuh yang dihasilkan melebihi 250 karakter, Macie juga akan memotong jalan, dimulai dengan elemen pertama yang ada di jalur, hingga jalan berisi 250 karakter atau lebih sedikit.

recordIndex Bulat Untuk wadah objek Avro atau file Parket, indeks record, mulai dari 0, untuk catatan yang berisi kejadian tersebut. Untuk file JSON Lines, indeks baris, mulai dari 0, untuk baris yang berisi kejadian tersebut. Nilai ini selalu 0 untuk file JSON.

Contoh berikut menunjukkan struktur Record objek yang menentukan lokasi terjadinya data sensitif yang Macie terdeteksi dalam file Parket.

"records": [ { "jsonPath": "$['abcdefghijklmnopqrstuvwxyz']", "recordIndex": 7663 } ]

Dalam contoh sebelumnya, temuan menunjukkan bahwa Macie mendeteksi data sensitif dalam catatan indeks 7663 (catatan nomor 7664). Dalam catatan itu, Macie mendeteksi data sensitif di bidang bernamaabcdefghijklmnopqrstuvwxyz. Jalur JSON penuh menuju bidang dalam catatan adalah $.abcdefghijklmnopqrstuvwxyz. Bidang adalah keturunan langsung dari objek root (tingkat luar).

Contoh berikut juga menunjukkan struktur Record objek untuk terjadinya data sensitif yang Macie terdeteksi dalam file Parket. Namun, dalam contoh ini, Macie dipotong nama bidang yang berisi kejadian karena nama melebihi batas karakter.

"records": [ { "jsonPath": "$['...uvwxyzabcdefghijklmnopqrstuvwxyzabcdefghijklmnopqrstuvwxyzabcdefghijklmnopqrstuvwxyzabcdefghijklmnopqrstuvwxyzabcdefghijklmnopqrstuvwxyzabcdefghijklmnopqrstuvwxyzabcdefghijklmnopqrstuvwxyzabcdefghijklmnopqrstuvwxyzabcdefghijklmnopqrstuvwxyz']", "recordIndex": 7663 } ]

Dalam contoh sebelumnya, bidang adalah keturunan langsung dari akar (tingkat luar) objek.

Pada contoh berikut, juga untuk terjadinya data sensitif yang Macie terdeteksi dalam file Parket, Macie dipotong path penuh ke bidang yang berisi kejadian tersebut. Jalur lengkap melebihi batas karakter.

"records": [ { "jsonPath": "$..usssn2.usssn3.usssn4.usssn5.usssn6.usssn7.usssn8.usssn9.usssn10.usssn11.usssn12.usssn13.usssn14.usssn15.usssn16.usssn17.usssn18.usssn19.usssn20.usssn21.usssn22.usssn23.usssn24.usssn25.usssn26.usssn27.usssn28.usssn29['abcdefghijklmnopqrstuvwxyz']", "recordIndex": 2335 } ]

Dalam contoh sebelumnya, temuan menunjukkan bahwa Macie mendeteksi data sensitif dalam catatan indeks 2335 (catatan nomor 2336). Dalam catatan itu, Macie mendeteksi data sensitif di bidang bernamaabcdefghijklmnopqrstuvwxyz. Jalur JSON lengkap ke bidang dalam catatan adalah:

$['1234567890']usssn1.usssn2.usssn3.usssn4.usssn5.usssn6.usssn7.usssn8.usssn9.usssn10.usssn11.usssn12.usssn13.usssn14.usssn15.usssn16.usssn17.usssn18.usssn19.usssn20.usssn21.usssn22.usssn23.usssn24.usssn25.usssn26.usssn27.usssn28.usssn29['abcdefghijklmnopqrstuvwxyz']

Contoh berikut menunjukkan struktur Record objek yang menentukan lokasi terjadinya data sensitif yang Macie terdeteksi dalam file JSON. Dalam contoh ini, terjadinya adalah nilai tertentu dalam array.

"records": [ { "jsonPath": "$.access.key[2]", "recordIndex": 0 } ]

Dalam contoh sebelumnya, temuan menunjukkan bahwa Macie mendeteksi data sensitif dalam nilai kedua dari array bernama. key Susunan adalah anak dari sebuah objek bernama access.

Contoh berikut menunjukkan struktur Record objek yang menentukan lokasi terjadinya data sensitif yang Macie terdeteksi dalam file JSON Lines.

"records": [ { "jsonPath": "$.access.key", "recordIndex": 3 } ]

Dalam contoh sebelumnya, temuan menunjukkan bahwa Macie mendeteksi data sensitif dalam nilai ketiga (baris) dalam file. Pada baris itu, terjadinya adalah dalam bidang bernamakey, yang merupakan anak dari sebuah objek bernamaaccess.