Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.
Skema JSON untuk lokasi data sensitif
Amazon Macie menggunakan struktur JSON standar untuk menyimpan informasi tentang tempat ia menemukan data sensitif di objek Amazon Simple Storage Service (Amazon S3). Struktur digunakan oleh temuan data sensitif dan hasil penemuan data sensitif. Untuk temuan data sensitif, struktur adalah bagian dari skema JSON untuk temuan. Untuk meninjau skema JSON lengkap untuk temuan, lihat Temuan di Referensi API Amazon Macie. Untuk mempelajari selengkapnya tentang hasil penemuan data sensitif, lihat Menyimpan dan mempertahankan hasil penemuan data sensitif.
Ikhtisar skema JSON untuk lokasi data sensitif
Untuk melaporkan lokasi data sensitif yang ditemukan Amazon Macie di objek S3 yang terpengaruh, skema JSON untuk temuan data sensitif dan hasil penemuan data sensitif mencakup satu objek dan satu customDataIdentifiers
objek. sensitiveData
customDataIdentifiers
Objek memberikan rincian tentang data yang Macie terdeteksi menggunakan pengidentifikasi data kustom. sensitiveData
Objek memberikan rincian tentang data yang Macie terdeteksi menggunakan pengidentifikasi data yang dikelola.
Setiap objek customDataIdentifiers
dan sensitiveData
berisi satu arraydetections
atau lebih:
-
Dalam sebuah
customDataIdentifiers
objek,detections
array menunjukkan pengidentifikasi data kustom mana yang mendeteksi data dan menghasilkan temuan. Untuk setiap pengidentifikasi data kustom, array juga menunjukkan jumlah kejadian data yang dideteksi pengidentifikasi. Array tersebut juga dapat menunjukkan lokasi data yang terdeteksi oleh pengenal. -
Pada objek
sensitiveData
, arraydetections
yang menunjukkan tipe data sensitif yang Macie deteksi menggunakan pengidentifikasi data terkelola. Untuk setiap tipe data sensitif, array juga menunjukkan jumlah kejadian dari data, dan dapat menunjukkan lokasi data.
Untuk temuan data sensitif, array detections
dapat mencakup 1-15 objek occurrences
. Setiap occurrences
objek menentukan di mana Macie mendeteksi kejadian individu dari jenis data sensitif tertentu.
Misalnya, detections
larik berikut menunjukkan lokasi tiga kejadian data sensitif (nomor Jaminan Sosial AS) yang ditemukan Macie dalam file CSV.
"sensitiveData": [
{
"category": "PERSONAL_INFORMATION",
"detections": [
{
"count": 30,
"occurrences": {
"cells": [
{
"cellReference": null,
"column": 1,
"columnName": "SSN",
"row": 2
},
{
"cellReference": null,
"column": 1,
"columnName": "SSN",
"row": 3
},
{
"cellReference": null,
"column": 1,
"columnName": "SSN",
"row": 4
}
]
},
"type": "USA_SOCIAL_SECURITY_NUMBER"
}
Lokasi dan jumlah occurrences
objek dalam detections
array bervariasi berdasarkan kategori, jenis, dan jumlah kejadian data sensitif yang dideteksi Macie selama siklus analisis penemuan data sensitif otomatis atau menjalankan pekerjaan penemuan data sensitif. Untuk setiap siklus analisis atau pekerjaan yang dijalankan, Macie menggunakan algoritma penelusuran kedalaman pertama untuk mengisi temuan yang dihasilkan dengan data lokasi selama 1—15 kejadian data sensitif yang dideteksi Macie di objek S3. Kejadian ini menunjukkan kategori dan jenis data sensitif yang mungkin berisi bucket dan objek S3 yang terpengaruh.
occurrences
Objek dapat berisi struktur berikut, tergantung pada jenis file atau format penyimpanan objek S3 yang terpengaruh:
-
Array
cells
- Array ini berlaku untuk buku kerja Microsoft Excel, file CSV, dan file TSV. Objek dalam array ini menentukan sel atau bidang yang Macie mendeteksi terjadinya data sensitif di. -
lineRanges
array - Array ini berlaku untuk pesan email (EML) file, dan file teks non-biner selain CSV, JSON, JSON Lines, dan file TSV — misalnya, HTML, TXT, dan file XML—misalnya, HTML, TXT, dan XML-file. Objek dalam array ini menentukan garis atau rentang garis inklusif yang Macie mendeteksi terjadinya data sensitif, dan posisi data pada garis atau garis yang ditentukan.Dalam kasus tertentu, objek dalam
lineRanges
array menentukan lokasi deteksi data sensitif dalam jenis file atau format penyimpanan yang didukung oleh jenis lain dari array. Kasus-kasus tersebut adalah: deteksi di bagian tidak terstruktur dari file yang terstruktur lain, seperti komentar dalam file; deteksi dalam file cacat yang dianalisis Macie sebagai plaintext; dan, file CSV atau TSV yang memiliki satu atau lebih nama kolom tempat Macie mendeteksi data sensitif masuk. -
Array
offsetRanges
- Array ini dicadangkan untuk penggunaan di waktu yang akan datang. Jika array ini hadir, nilai untuk itu adalah null. -
Array
pages
- Array ini berlaku untuk file Adobe Portable Document Format (PDF). Objek dalam array ini menentukan halaman yang Macie mendeteksi terjadinya data sensitif di. -
Array
records
- Array ini berlaku untuk kontainer objek Apache Avro, file Apache Parket, file JSON, dan file JSON Lines. Untuk Avro objek kontainer dan file Parket, objek dalam array ini menentukan indeks record dan path ke lapangan dalam catatan bahwa Macie mendeteksi terjadinya data sensitif di. Untuk file JSON dan JSON Lines, objek dalam array ini menentukan jalur ke bidang atau array yang Macie mendeteksi terjadinya data sensitif di. Untuk file JSON Lines, hal itu juga menentukan indeks dari baris yang berisi data.
Isi dari susunan ini bervariasi berdasarkan tipe file atau format penyimpanan objek S3 terpengaruh dan isinya.
Rincian skema JSON dan contoh untuk lokasi data sensitif
Amazon Macie menyesuaikan konten struktur JSON yang digunakannya untuk menunjukkan di mana ia mendeteksi data sensitif dalam jenis file dan konten tertentu. Topik berikut menjelaskan dan memberikan contoh struktur ini.
Untuk daftar lengkap struktur JSON yang dapat disertakan dalam temuan data sensitif, lihat Temuan di Referensi API Amazon Macie.
Cell array
Berlaku untuk: Buku kerja Microsoft Excel, file CSV, dan file TSV
Dalam cells
array, Cell
objek menentukan sel atau bidang yang Macie mendeteksi terjadinya data sensitif di. Tabel berikut menjelaskan tujuan masing-masing bidang dalam objek Cell
.
Bidang | Tipe | Deskripsi |
---|---|---|
cellReference |
String | Lokasi sel, sebagai referensi sel absolut, yang berisi kejadian tersebut. Bidang ini hanya berlaku untuk buku kerja Excel. Nilai ini adalah tidak berlaku untuk file CSV dan TSV. |
column |
Bulat | Jumlah kolom kolom yang berisi kejadian tersebut. Untuk buku kerja Excel, nilai ini berkorelasi dengan karakter abjad (-abjad) untuk pengidentifikasi kolom — misalnya, 1 untuk kolom A, 2 untuk kolom B, dan seterusnya. |
columnName |
String | Nama kolom yang berisi kejadian, jika tersedia. |
row |
Bulat | Nomor baris baris yang berisi kejadian tersebut. |
Contoh berikut menunjukkan struktur Cell
objek yang menentukan lokasi terjadinya data sensitif yang Macie terdeteksi dalam file CSV.
"cells": [
{
"cellReference": null,
"column": 3,
"columnName": "SSN",
"row": 5
}
]
Dalam contoh sebelumnya, temuan menunjukkan bahwa Macie mendeteksi data sensitif di bidang di baris kelima dari kolom ketiga (bernama SSN) dari file.
Contoh berikut menunjukkan struktur Cell
objek yang menentukan lokasi terjadinya data sensitif yang Macie terdeteksi dalam buku kerja Excel.
"cells": [
{
"cellReference": "Sheet2!C5",
"column": 3,
"columnName": "SSN",
"row": 5
}
]
Pada contoh sebelumnya, temuan menunjukkan bahwa Macie mendeteksi data sensitif di lembar kerja bernama Sheet2 di buku kerja. Di lembar kerja itu, Macie mendeteksi data sensitif di sel di baris kelima kolom ketiga (kolom C, bernama SSN).
LineRangessusunan
Berlaku untuk: Email message (EML) file, dan file teks non-biner selain CSV, JSON, JSON Lines, dan file TSV — misalnya, HTML, TXT, dan file XML—misalnya, HTML, TXT, dan XML-file
Dalam lineRanges
array, Range
objek menentukan garis atau rentang garis inklusif yang Macie mendeteksi terjadinya data sensitif, dan posisi data pada garis atau garis yang ditentukan.
Objek ini sering kosong demi tipe file yang didukung oleh tipe lain dari susunan di objek occurrences
. Pengecualian nya adalah:
-
Data di bagian yang tidak terstruktur dari file lain yang terstruktur, seperti komentar dalam file.
-
Data dalam file cacat ketika Macie menganalisisnya sebagai plaintext.
-
File CSV atau TSV yang memiliki satu atau beberapa nama kolom tempat Macie mendeteksi data sensitif.
Tabel berikut menjelaskan tujuan masing-masing bidang dalam Objek Range
dari objek susunan lineRanges
.
Bidang | Tipe | Deskripsi |
---|---|---|
end |
Bulat | Jumlah baris dari awal file sampai akhir kejadian. |
start |
Bulat | Jumlah baris dari awal file ke awal terjadinya. |
startColumn |
Bulat | Jumlah karakter, dengan spasi dan mulai dari 1, dari awal baris pertama yang berisi kejadian (start ) hingga awal terjadinya. |
Contoh berikut menunjukkan struktur Range
objek yang menentukan lokasi terjadinya data sensitif yang Macie terdeteksi pada satu baris dalam file TXT.
"lineRanges": [
{
"end": 1,
"start": 1,
"startColumn": 119
}
]
Dalam contoh sebelumnya, temuan menunjukkan bahwa Macie mendeteksi kejadian lengkap data sensitif (alamat surat) di baris pertama file. Karakter pertama dalam kejadian adalah 119 karakter (dengan spasi) dimulai dari awal baris itu.
Contoh berikut menunjukkan struktur Range
objek yang menentukan lokasi terjadinya data sensitif yang mencakup beberapa baris dalam file TXT.
"lineRanges": [
{
"end": 54,
"start": 51,
"startColumn": 1
}
]
Dalam contoh sebelumnya, temuan menunjukkan bahwa Macie mendeteksi terjadinya data sensitif (alamat surat) yang mencakup baris 51 hingga 54 file. Karakter pertama dalam kejadian merupakan karakter pertama di baris 51 dari file.
Array halaman
Berlaku untuk: File Adobe Portable Dokumen Format (PDF)
Dalam pages
array, Page
objek menentukan halaman yang Macie mendeteksi terjadinya data sensitif di. Objek berisi bidang pageNumber
. pageNumber
Bidang menyimpan integer yang menentukan nomor halaman halaman yang berisi kejadian tersebut.
Contoh berikut menunjukkan struktur Page
objek yang menentukan lokasi terjadinya data sensitif yang Macie terdeteksi dalam file PDF.
"pages": [
{
"pageNumber": 10
}
]
Pada contoh sebelumnya, temuan menunjukkan bahwa halaman 10 file berisi kejadian tersebut.
Array catatan
Berlaku untuk: Kontainer objek Apache Avro, file Apache Parket, file JSON, dan file JSON Lines
Untuk wadah objek Avro atau file Parket, Record
objek dalam records
array menentukan indeks record dan path ke lapangan dalam catatan yang Macie mendeteksi terjadinya data sensitif di. Untuk file JSON dan JSON Lines, Record
objek menentukan jalur ke bidang atau larik tempat Macie mendeteksi terjadinya data sensitif. Untuk file JSON Lines, itu juga menentukan indeks baris yang berisi kejadian tersebut.
Tabel berikut menjelaskan tujuan masing-masing bidang dalam objek Record
.
Bidang | Tipe | Deskripsi |
---|---|---|
jsonPath |
String |
Jalan, sebagai ekspresi JSONPath, untuk terjadinya. Untuk wadah objek Avro atau file Parket, ini adalah path ke bidang dalam record ( Jika Macie mendeteksi data sensitif pada nama elemen apa pun di jalur, Macie menghilangkan bidang |
recordIndex |
Bulat | Untuk wadah objek Avro atau file Parket, indeks record, mulai dari 0, untuk catatan yang berisi kejadian tersebut. Untuk file JSON Lines, indeks baris, mulai dari 0, untuk baris yang berisi kejadian tersebut. Nilai ini selalu 0 untuk file JSON. |
Contoh berikut menunjukkan struktur Record
objek yang menentukan lokasi terjadinya data sensitif yang Macie terdeteksi dalam file Parket.
"records": [
{
"jsonPath": "$['abcdefghijklmnopqrstuvwxyz']",
"recordIndex": 7663
}
]
Dalam contoh sebelumnya, temuan menunjukkan bahwa Macie mendeteksi data sensitif dalam catatan indeks 7663 (catatan nomor 7664). Dalam catatan itu, Macie mendeteksi data sensitif di bidang bernamaabcdefghijklmnopqrstuvwxyz
. Jalur JSON penuh menuju bidang dalam catatan adalah $.abcdefghijklmnopqrstuvwxyz
. Bidang adalah keturunan langsung dari objek root (tingkat luar).
Contoh berikut juga menunjukkan struktur Record
objek untuk terjadinya data sensitif yang Macie terdeteksi dalam file Parket. Namun, dalam contoh ini, Macie dipotong nama bidang yang berisi kejadian karena nama melebihi batas karakter.
"records": [
{
"jsonPath": "$['...uvwxyzabcdefghijklmnopqrstuvwxyzabcdefghijklmnopqrstuvwxyzabcdefghijklmnopqrstuvwxyzabcdefghijklmnopqrstuvwxyzabcdefghijklmnopqrstuvwxyzabcdefghijklmnopqrstuvwxyzabcdefghijklmnopqrstuvwxyzabcdefghijklmnopqrstuvwxyzabcdefghijklmnopqrstuvwxyz']",
"recordIndex": 7663
}
]
Dalam contoh sebelumnya, bidang adalah keturunan langsung dari akar (tingkat luar) objek.
Pada contoh berikut, juga untuk terjadinya data sensitif yang Macie terdeteksi dalam file Parket, Macie dipotong path penuh ke bidang yang berisi kejadian tersebut. Jalur lengkap melebihi batas karakter.
"records": [
{
"jsonPath": "$..usssn2.usssn3.usssn4.usssn5.usssn6.usssn7.usssn8.usssn9.usssn10.usssn11.usssn12.usssn13.usssn14.usssn15.usssn16.usssn17.usssn18.usssn19.usssn20.usssn21.usssn22.usssn23.usssn24.usssn25.usssn26.usssn27.usssn28.usssn29['abcdefghijklmnopqrstuvwxyz']",
"recordIndex": 2335
}
]
Dalam contoh sebelumnya, temuan menunjukkan bahwa Macie mendeteksi data sensitif dalam catatan indeks 2335 (catatan nomor 2336). Dalam catatan itu, Macie mendeteksi data sensitif di bidang bernamaabcdefghijklmnopqrstuvwxyz
. Jalur JSON lengkap ke bidang dalam catatan adalah:
$['1234567890']usssn1.usssn2.usssn3.usssn4.usssn5.usssn6.usssn7.usssn8.usssn9.usssn10.usssn11.usssn12.usssn13.usssn14.usssn15.usssn16.usssn17.usssn18.usssn19.usssn20.usssn21.usssn22.usssn23.usssn24.usssn25.usssn26.usssn27.usssn28.usssn29['abcdefghijklmnopqrstuvwxyz']
Contoh berikut menunjukkan struktur Record
objek yang menentukan lokasi terjadinya data sensitif yang Macie terdeteksi dalam file JSON. Dalam contoh ini, terjadinya adalah nilai tertentu dalam array.
"records": [
{
"jsonPath": "$.access.key[2]",
"recordIndex": 0
}
]
Dalam contoh sebelumnya, temuan menunjukkan bahwa Macie mendeteksi data sensitif dalam nilai kedua dari array bernama. key
Susunan adalah anak dari sebuah objek bernama access
.
Contoh berikut menunjukkan struktur Record
objek yang menentukan lokasi terjadinya data sensitif yang Macie terdeteksi dalam file JSON Lines.
"records": [
{
"jsonPath": "$.access.key",
"recordIndex": 3
}
]
Dalam contoh sebelumnya, temuan menunjukkan bahwa Macie mendeteksi data sensitif dalam nilai ketiga (baris) dalam file. Pada baris itu, terjadinya adalah dalam bidang bernamakey
, yang merupakan anak dari sebuah objek bernamaaccess
.