Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.
Persyaratan kata kunci untuk pengidentifikasi data terkelola
Untuk mendeteksi jenis data sensitif tertentu dengan menggunakan pengidentifikasi data terkelola, Amazon Macie memerlukan kata kunci agar berada di dekat data. Jika ini adalah kasus untuk jenis data tertentu, topik referensi di bagian ini menunjukkan persyaratan kata kunci untuk data tersebut.
Jika kata kunci harus berada di dekat tipe data tertentu, kata kunci biasanya harus berada dalam 30 karakter (inklusif) dari data tersebut. Persyaratan kedekatan tambahan bervariasi berdasarkan jenis file atau format penyimpanan objek Amazon Simple Storage Service (Amazon S3).
- Terstruktur, data kolumnar
-
Untuk data kolumnar, kata kunci harus menjadi bagian dari nilai yang sama atau dalam nama kolom atau bidang yang menyimpan nilai. Ini adalah kasus untuk buku kerja, CSV file, dan TSV file Microsoft Excel.
Misalnya, jika nilai untuk bidang berisi keduanya SSNdan angka sembilan digit yang menggunakan sintaks nomor Jaminan Sosial AS (SSN), Macie dapat mendeteksi di bidang tersebutSSN. Demikian pula, jika nama kolom berisi SSN, Macie dapat mendeteksi masing-masing SSN di kolom. Macie memperlakukan nilai-nilai di kolom itu sebagai kedekatan dengan kata kunci SSN.
- Data terstruktur dan berbasis catatan
-
Untuk data berbasis catatan, kata kunci harus menjadi bagian dari nilai yang sama atau dalam nama elemen di dalam jalur ke bidang atau susunan yang menyimpan nilai. Ini adalah kasus untuk wadah objek Apache Avro, file Apache Parquet, file, dan file JSON Lines. JSON
Misalnya, jika nilai untuk bidang berisi kredensi dan urutan karakter yang menggunakan sintaks AWS kunci akses rahasia, Macie dapat mendeteksi kunci di lapangan. Demikian pula, jika jalur ke bidang adalah
$.credentials.aws.key
, Macie dapat mendeteksi AWS kunci akses rahasia di lapangan. Macie memperlakukan nilai di lapangan sebagai kedekatan dengan kredensi kata kunci. - Data tidak terstruktur
-
Tidak ada persyaratan kedekatan tambahan untuk file Adobe Portable Document Format, dokumen Microsoft Word, pesan email, dan file teks non-biner selainCSV,JSON, JSON Lines, dan TSV file. Kata kunci biasanya harus berada dalam 30 karakter (inklusif) dari data tersebut. Hal ini termasuk data terstruktur apa pun, seperti tabel, dalam tipe file ini.
Kata kunci tidak sensitif terhadap kasus. Selain itu, jika kata kunci berisi spasi, Macie secara otomatis mencocokkan variasi kata kunci yang tidak berisi spasi atau berisi garis bawah (_) atau tanda hubung (-) alih-alih spasi. Dalam kasus tertentu, Macie juga memperluas atau menyingkat kata kunci untuk mengatasi variasi umum kata kunci.
Untuk demonstrasi bagaimana kata kunci memberikan konteks dan membantu Macie mendeteksi jenis data sensitif tertentu, tonton video berikut: