Izinkan opsi dan persyaratan daftar di Amazon Macie - Amazon Macie

Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.

Izinkan opsi dan persyaratan daftar di Amazon Macie

Di Amazon Macie, Anda dapat menggunakan daftar izinkan untuk menentukan pola teks atau teks yang ingin diabaikan Macie saat memeriksa objek Amazon Simple Storage Service (Amazon S3) untuk data sensitif. Macie menyediakan opsi untuk dua jenis daftar izinkan, teks yang telah ditentukan dan ekspresi reguler.

Daftar teks yang telah ditentukan sangat membantu jika Anda ingin Macie mengabaikan kata, frasa, dan jenis urutan karakter tertentu yang Anda anggap tidak sensitif. Contohnya adalah nama perwakilan publik untuk organisasi Anda, nomor telepon tertentu, atau data sampel spesifik yang digunakan organisasi Anda untuk pengujian. Jika Macie menemukan teks yang cocok dengan kriteria pengenal data terkelola atau kustom dan teks juga cocok dengan entri dalam daftar izin, Macie tidak melaporkan terjadinya teks tersebut dalam temuan data sensitif, statistik, dan jenis hasil lainnya.

Ekspresi reguler (regex) sangat membantu jika Anda ingin Macie mengabaikan teks yang bervariasi atau cenderung berubah sambil juga mengikuti pola umum. Regex menentukan pola teks untuk diabaikan. Contohnya adalah nomor telepon publik untuk organisasi Anda, alamat email untuk domain organisasi Anda, atau data sampel berpola yang digunakan organisasi Anda untuk pengujian. Jika Macie menemukan teks yang cocok dengan kriteria pengenal data terkelola atau kustom dan teks juga cocok dengan pola regex dalam daftar izin, Macie tidak melaporkan terjadinya teks tersebut dalam temuan data sensitif, statistik, dan jenis hasil lainnya.

Anda dapat membuat dan menggunakan kedua jenis daftar izin di semua Wilayah AWS tempat Macie saat ini tersedia kecuali Wilayah Asia Pasifik (Osaka). Saat Anda membuat dan mengelola daftar izin, ingatlah opsi dan persyaratan berikut. Perhatikan juga bahwa mengizinkan entri daftar dan pola regex untuk alamat surat tidak didukung.

Pilihan dan persyaratan untuk daftar teks yang telah ditentukan

Untuk jenis daftar izinkan ini, Anda menyediakan file teks biasa yang dibatasi baris yang mencantumkan urutan karakter tertentu untuk diabaikan. Entri daftar biasanya kata-kata, frasa, dan jenis urutan karakter lainnya yang Anda anggap tidak sensitif, tidak mungkin berubah, dan tidak harus mematuhi pola tertentu. Jika Anda menggunakan jenis daftar ini, Amazon Macie tidak melaporkan kemunculan teks yang sama persis dengan entri dalam daftar. Macie memperlakukan setiap entri daftar sebagai nilai literal string.

Untuk menggunakan jenis daftar izinkan ini, mulailah dengan membuat daftar di editor teks dan menyimpannya sebagai file teks biasa. Kemudian unggah daftar ke bucket tujuan umum S3. Juga pastikan bahwa pengaturan penyimpanan dan enkripsi untuk bucket dan objek memungkinkan Macie untuk mengambil dan mendekripsi daftar. Kemudian buat dan konfigurasikan pengaturan untuk daftar di Macie.

Setelah Anda mengonfigurasi pengaturan di Macie, kami sarankan Anda menguji daftar izinkan dengan kumpulan data kecil yang representatif untuk akun atau organisasi Anda. Untuk menguji daftar, Anda dapat membuat pekerjaan satu kali dan mengonfigurasi pekerjaan untuk menggunakan daftar selain pengidentifikasi data terkelola dan pengidentifikasi data khusus yang biasanya Anda gunakan untuk menganalisis data. Anda kemudian dapat meninjau hasil pekerjaan—temuan data sensitif, hasil penemuan data sensitif, atau keduanya. Jika hasil pekerjaan berbeda dari yang Anda harapkan, Anda dapat mengubah dan menguji daftar sampai hasilnya sesuai dengan yang Anda harapkan.

Setelah selesai mengonfigurasi dan menguji daftar izin, Anda dapat membuat dan mengonfigurasi pekerjaan tambahan untuk menggunakannya, atau menambahkannya ke pengaturan penemuan data sensitif otomatis untuk akun Anda. Ketika pekerjaan tersebut mulai berjalan atau siklus analisis penemuan otomatis berikutnya dimulai, Macie mengambil versi terbaru dari daftar dari Amazon S3 dan menyimpannya dalam memori sementara. Macie kemudian menggunakan salinan sementara daftar ini ketika memeriksa objek S3 untuk data sensitif. Ketika pekerjaan selesai berjalan atau siklus analisis selesai, Macie secara permanen menghapus salinan daftarnya dari memori. Daftar ini tidak bertahan di Macie. Hanya pengaturan daftar yang bertahan di Macie.

penting

Karena daftar teks yang telah ditentukan tidak bertahan di Macie, penting untuk memeriksa status daftar izin Anda secara berkala. Jika Macie tidak dapat mengambil atau mengurai daftar yang Anda konfigurasi pekerjaan atau penemuan otomatis untuk digunakan, Macie tidak menggunakan daftar tersebut. Ini mungkin menghasilkan hasil yang tidak terduga, seperti temuan data sensitif untuk teks yang Anda tentukan dalam daftar.

Persyaratan sintaks

Saat Anda membuat daftar izinkan jenis ini, perhatikan persyaratan berikut untuk file daftar:

  • Daftar harus disimpan sebagai file plaintext (text/plain), seperti file.txt, .text, atau .plain.

  • Daftar harus menggunakan jeda baris untuk memisahkan entri individu. Sebagai contoh:

    Akua Mansa John Doe Martha Rivera 425-555-0100 425-555-0101 425-555-0102

    Macie memperlakukan setiap baris sebagai entri tunggal yang berbeda dalam daftar. File ini juga dapat berisi baris kosong untuk meningkatkan keterbacaan. Macie melewatkan baris kosong saat mem-parsing file.

  • Setiap entri dapat berisi 1-90 UTF—8 karakter.

  • Setiap entri harus lengkap dan sama persis agar teks diabaikan. Macie tidak mendukung penggunaan karakter wildcard atau nilai parsi untuk entri. Macie memperlakukan setiap entri sebagai nilai literal string. Pertandingan tidak peka huruf besar/kecil.

  • File dapat berisi 1-100.000 entri.

  • Ukuran penyimpanan total file tidak boleh melebihi 35 MB.

Persyaratan penyimpanan

Saat Anda menambahkan dan mengelola daftar izin di Amazon S3, perhatikan persyaratan dan rekomendasi penyimpanan berikut:

  • Dukungan regional — Daftar izin harus disimpan dalam ember yang Wilayah AWS sama dengan akun Macie Anda. Macie tidak dapat mengakses daftar izin jika disimpan di Wilayah yang berbeda.

  • Kepemilikan Bucket — Daftar izin harus disimpan dalam ember yang dimiliki oleh Anda Akun AWS. Jika Anda ingin akun lain menggunakan daftar izin yang sama, pertimbangkan untuk membuat aturan replikasi Amazon S3 untuk mereplikasi daftar ke bucket yang dimiliki oleh akun tersebut. Untuk informasi tentang mereplikasi objek S3, lihat Mereplikasi objek di Panduan Pengguna Layanan Penyimpanan Sederhana Amazon.

    Selain itu, identitas AWS Identity and Access Management (IAM) Anda harus memiliki akses baca ke bucket dan objek yang menyimpan daftar. Jika tidak, Anda tidak akan diizinkan untuk membuat atau memperbarui pengaturan daftar atau memeriksa status daftar dengan menggunakan Macie.

  • Jenis dan kelas penyimpanan — Daftar izin harus disimpan dalam bucket tujuan umum, bukan bucket direktori. Selain itu, harus disimpan menggunakan salah satu kelas penyimpanan berikut: Reduced Redundancy (RRS), S3 Glacier Instant Retrieval, S3 Intelligent-Tiering, S3 One Zone-IA, S3 Standard, atau S3 Standard-IA.

  • Kebijakan bucket — Jika Anda menyimpan daftar izin di bucket yang memiliki kebijakan bucket terbatas, pastikan kebijakan tersebut mengizinkan Macie untuk mengambil daftar tersebut. Untuk melakukannya, Anda dapat menambahkan kondisi untuk peran terkait layanan Macie ke kebijakan bucket. Untuk informasi selengkapnya, lihat Mengizinkan Macie untuk mengakses bucket S3 dan objek.

    Pastikan juga bahwa kebijakan tersebut memungkinkan identitas IAM Anda memiliki akses baca ke bucket. Jika tidak, Anda tidak akan diizinkan untuk membuat atau memperbarui pengaturan daftar atau memeriksa status daftar dengan menggunakan Macie.

  • Jalur objek - Jika Anda menyimpan lebih dari satu daftar izin di Amazon S3, jalur objek untuk setiap daftar harus unik. Dengan kata lain, setiap daftar izinkan harus disimpan secara terpisah sebagai objek S3-nya sendiri.

  • Pembuatan Versi — Saat menambahkan daftar izin ke bucket, sebaiknya Anda juga mengaktifkan pembuatan versi untuk bucket. Anda kemudian dapat menggunakan nilai tanggal dan waktu untuk mengkorelasikan versi daftar dengan hasil pekerjaan penemuan data sensitif dan siklus penemuan data sensitif otomatis yang menggunakan daftar. Ini dapat membantu audit privasi dan perlindungan data atau investigasi yang Anda lakukan.

  • Kunci Objek — Untuk mencegah daftar izin dihapus atau ditimpa untuk jangka waktu tertentu atau tanpa batas waktu, Anda dapat mengaktifkan Object Lock untuk bucket yang menyimpan daftar. Mengaktifkan pengaturan ini tidak mencegah Macie mengakses daftar. Untuk informasi tentang pengaturan ini, lihat Menggunakan Lock Object S3 di Panduan Pengguna Amazon Simple Storage Service.

Persyaratan enkripsi/Dekripsi

Jika Anda mengenkripsi daftar izin di Amazon S3, kebijakan izin untuk peran terkait layanan Macie biasanya memberi Macie izin yang diperlukan untuk mendekripsi daftar. Namun, ini tergantung pada jenis enkripsi yang digunakan:

  • Jika daftar dienkripsi menggunakan enkripsi sisi server dengan kunci terkelola Amazon S3 (SSE-S3), Macie dapat mendekripsi daftar tersebut. Peran terkait layanan untuk akun Macie Anda memberi Macie izin yang dibutuhkan.

  • Jika daftar dienkripsi menggunakan enkripsi sisi server dengan AWS terkelola AWS KMS key (DSSE-KMS atau SSE-KMS), Macie dapat mendekripsi daftar tersebut. Peran terkait layanan untuk akun Macie Anda memberi Macie izin yang dibutuhkan.

  • Jika daftar dienkripsi menggunakan enkripsi sisi server dengan pelanggan yang dikelola AWS KMS key (DSSE-KMS atau SSE-KMS), Macie dapat mendekripsi daftar hanya jika Anda mengizinkan Macie untuk menggunakan kunci. Untuk mempelajari cara melakukannya, lihat Mengizinkan Macie menggunakan pelanggan yang dikelola AWS KMS key.

    catatan

    Anda dapat mengenkripsi daftar dengan pelanggan yang dikelola AWS KMS key di toko kunci eksternal. Namun, kuncinya mungkin lebih lambat dan kurang dapat diandalkan daripada kunci yang dikelola sepenuhnya di dalamnya AWS KMS. Jika latensi atau masalah ketersediaan mencegah Macie mendekripsi daftar, Macie tidak menggunakan daftar saat menganalisis objek S3. Ini mungkin menghasilkan hasil yang tidak terduga, seperti temuan data sensitif untuk teks yang Anda tentukan dalam daftar. Untuk mengurangi risiko ini, pertimbangkan untuk menyimpan daftar dalam bucket S3 yang dikonfigurasi untuk menggunakan kunci sebagai Kunci Bucket S3.

    Untuk informasi tentang penggunaan kunci KMS di penyimpanan kunci eksternal, lihat Penyimpanan kunci eksternal di Panduan AWS Key Management Service Pengembang. Untuk informasi tentang menggunakan Kunci Bucket S3, lihat Mengurangi biaya SSE-KMS dengan Kunci Bucket Amazon S3 di Panduan Pengguna Layanan Penyimpanan Sederhana Amazon.

  • Jika daftar dienkripsi menggunakan enkripsi sisi server dengan kunci yang disediakan pelanggan (SSE-C) atau enkripsi sisi klien, Macie tidak dapat mendekripsi daftar tersebut. Pertimbangkan untuk menggunakan enkripsi SSE-S3, DSSE-KMS, atau SSE-KMS sebagai gantinya.

Jika daftar dienkripsi dengan kunci KMS AWS terkelola atau kunci KMS yang dikelola pelanggan, identitas AWS Identity and Access Management (IAM) Anda juga harus diizinkan untuk menggunakan kunci tersebut. Jika tidak, Anda tidak akan diizinkan untuk membuat atau memperbarui pengaturan daftar atau memeriksa status daftar dengan menggunakan Macie. Untuk mempelajari cara memeriksa atau mengubah izin untuk kunci KMS, lihat Kebijakan kunci AWS KMS di Panduan AWS Key Management Service Pengembang.

Untuk informasi terperinci tentang opsi enkripsi untuk data Amazon S3, lihat Melindungi data dengan enkripsi di Panduan Pengguna Layanan Penyimpanan Sederhana Amazon.

Pertimbangan dan rekomendasi desain

Secara umum, Macie memperlakukan setiap entri dalam daftar izinkan sebagai nilai literal string. Artinya, Macie mengabaikan setiap kemunculan teks yang sama persis dengan entri lengkap dalam daftar izinkan. Pertandingan tidak peka huruf besar/kecil.

Namun, Macie menggunakan entri sebagai bagian dari ekstraksi data dan kerangka analisis yang lebih besar. Kerangka kerja ini mencakup pembelajaran mesin dan fungsi pencocokan pola yang memfaktorkan dimensi seperti variasi tata bahasa dan sintaksis dan, dalam banyak kasus, kedekatan kata kunci. Kerangka kerja juga memfaktorkan jenis file atau format penyimpanan objek S3. Oleh karena itu, ingatlah pertimbangan dan rekomendasi berikut saat Anda menambahkan dan mengelola entri dalam daftar izin.

Mempersiapkan berbagai jenis file dan format penyimpanan

Untuk data yang tidak terstruktur, seperti teks dalam file Adobe Portable Document Format (.pdf), Macie mengabaikan teks yang sama persis dengan entri lengkap dalam daftar izin, termasuk teks yang mencakup beberapa baris atau halaman.

Untuk data terstruktur, seperti data kolumnar dalam file CSV atau data berbasis rekaman dalam file JSON, Macie mengabaikan teks yang sama persis dengan entri lengkap dalam daftar izin jika semua teks disimpan dalam satu bidang, sel, atau array. Persyaratan ini tidak berlaku untuk data terstruktur yang disimpan dalam file yang tidak terstruktur, seperti tabel dalam file.pdf.

Misalnya, pertimbangkan konten berikut dalam file CSV:

Name,Account ID Akua Mansa,111111111111 John Doe,222222222222

Jika Akua Mansa dan John Doe merupakan entri dalam daftar izinkan, Macie mengabaikan nama-nama itu di file CSV. Teks lengkap dari setiap entri daftar disimpan dalam satu Name bidang.

Sebaliknya, pertimbangkan file CSV yang berisi kolom dan bidang berikut:

First Name,Last Name,Account ID Akua,Mansa,111111111111 John,Doe,222222222222

Jika Akua Mansa dan John Doe merupakan entri dalam daftar izinkan, Macie tidak mengabaikan nama-nama itu di file CSV. Tak satu pun bidang dalam file CSV berisi teks lengkap entri dalam daftar izinkan.

Sertakan variasi umum

Tambahkan entri untuk variasi umum data numerik, kata benda yang tepat, istilah, dan urutan karakter alfanumerik. Misalnya, jika Anda menambahkan nama atau frasa yang hanya berisi satu spasi di antara kata-kata, tambahkan juga variasi yang mencakup dua spasi di antara kata. Demikian pula, tambahkan kata dan frasa yang mengandung dan tidak mengandung karakter khusus, dan pertimbangkan untuk menyertakan variasi sintaksis dan semantik yang umum.

Untuk nomor telepon AS 425-555-0100, misalnya, Anda dapat menambahkan entri ini ke daftar izin:

425-555-0100 425.555.0100 (425) 555-0100 +1-425-555-0100

Untuk tanggal 1 Februari 2022 dalam konteks multinasional, Anda dapat menambahkan entri yang menyertakan variasi sintaksis umum untuk bahasa Inggris dan Prancis, termasuk variasi yang menyertakan dan tidak menyertakan karakter khusus:

February 1, 2022 1 février 2022 1 fevrier 2022 Feb 01, 2022 1 fév 2022 1 fev 2022 02/01/2022 01/02/2022

Untuk nama orang, sertakan entri untuk berbagai bentuk nama yang Anda anggap tidak sensitif. Misalnya, sertakan: nama depan diikuti dengan nama belakang; nama belakang diikuti dengan nama depan, nama depan dan belakang dipisahkan oleh satu spasi; nama depan dan belakang dipisahkan oleh dua spasi; dan nama panggilan.

Untuk nama Martha Rivera, misalnya, Anda dapat menambahkan:

Martha Rivera Martha Rivera Rivera, Martha Rivera, Martha Rivera Martha Rivera Martha

Jika Anda ingin mengabaikan variasi nama tertentu yang berisi banyak bagian, buat daftar izinkan yang menggunakan ekspresi reguler sebagai gantinya. Misalnya, untuk nama Dr. Martha Lyda Rivera, PhD, Anda dapat menggunakan ekspresi reguler berikut:. ^(Dr. )?Martha\s(Lyda|L\.)?\s?Rivera,?( PhD)?$

Opsi dan persyaratan untuk ekspresi reguler dalam daftar izinkan

Untuk jenis daftar izinkan ini, Anda menentukan ekspresi reguler (regex) yang mendefinisikan pola teks yang akan diabaikan — misalnya, nomor telepon publik untuk organisasi Anda, alamat email untuk domain organisasi Anda, atau data sampel berpola yang digunakan organisasi Anda untuk pengujian. Regex mendefinisikan pola umum untuk jenis data tertentu yang Anda anggap tidak sensitif. Jika Anda menggunakan jenis daftar izinkan ini, Amazon Macie tidak melaporkan kemunculan teks yang benar-benar cocok dengan pola yang ditentukan. Tidak seperti daftar izinkan yang menentukan teks yang telah ditentukan untuk diabaikan, Anda membuat dan menyimpan regex dan semua pengaturan daftar lainnya di Macie.

Saat membuat atau memperbarui jenis daftar izin ini, Anda dapat menguji regex daftar dengan data sampel sebelum menyimpan daftar. Kami menyarankan Anda melakukan ini dengan beberapa set data sampel. Jika Anda membuat regex yang terlalu umum, Macie mungkin mengabaikan kemunculan teks yang Anda anggap sensitif. Jika regex terlalu spesifik, Macie mungkin tidak mengabaikan kemunculan teks yang Anda anggap tidak sensitif. Untuk melindungi dari ekspresi yang salah bentuk atau berjalan lama, Macie juga mengkompilasi dan menguji regex terhadap kumpulan teks sampel secara otomatis, dan memberi tahu Anda tentang masalah yang harus diatasi.

Untuk pengujian tambahan, sebaiknya Anda juga menguji regex daftar dengan kumpulan data kecil yang representatif untuk akun atau organisasi Anda. Untuk melakukan ini, Anda dapat membuat pekerjaan satu kali dan mengonfigurasi pekerjaan untuk menggunakan daftar selain pengidentifikasi data terkelola dan pengidentifikasi data khusus yang biasanya Anda gunakan untuk menganalisis data. Anda kemudian dapat meninjau hasil pekerjaan—temuan data sensitif, hasil penemuan data sensitif, atau keduanya. Jika hasil pekerjaan berbeda dari yang Anda harapkan, Anda dapat mengubah dan menguji regex hingga hasilnya sesuai dengan yang Anda harapkan.

Setelah mengonfigurasi dan menguji daftar izin, Anda dapat membuat dan mengonfigurasi pekerjaan tambahan untuk menggunakannya, atau menambahkannya ke pengaturan penemuan data sensitif otomatis untuk akun Anda. Saat pekerjaan tersebut dijalankan atau Macie melakukan penemuan otomatis untuk akun Anda, Macie menggunakan versi terbaru dari daftar regex untuk menganalisis data.

Dukungan dan rekomendasi sintaks

Daftar allow dapat menentukan ekspresi reguler (regex) yang berisi sebanyak 512 karakter. Macie mendukung subset dari sintaks pola regex yang disediakan oleh Pustaka Perl Compatible Regular Expressions (PCRE). Dari konstruksi yang disediakan oleh pustaka PCRE, Macie tidak mendukung elemen pola berikut:

  • Backreferences

  • Mengambil grup

  • Pola bersyarat

  • Kode sematan

  • Pola bendera global, seperti /i, /m, dan /x

  • Pola rekursif

  • Asersi lebar nol lookbehind dan lookahead positif dan negatif, seperti ?=, ?!, ?<=, dan ?<!

Untuk membuat pola regex yang efektif untuk daftar izinkan, perhatikan juga tips dan rekomendasi berikut:

  • Jangkar — Gunakan jangkar (^atau$) hanya jika Anda mengharapkan pola muncul di awal atau akhir file, bukan awal atau akhir baris.

  • Bounded repeat — Untuk alasan performa, Macie membatasi ukuran grup bounded repeat. Misalnya, \d{100,1000} tidak akan dikompilasi di Macie. Untuk memperkirakan fungsionalitas ini, Anda dapat menggunakan open ended repeat seperti \d{100,}.

  • Ketidakpekaan huruf besar kecil — Untuk membuat bagian pola menjadu tidak peka huruf besar kecil, Anda dapat menggunakan construct (?i) bukan bendera /i.

  • Performa — Prefiks atau pergantian tidak perlu dioptimalkan secara manual. Misalnya, mengubah /hello|hi|hey/ menjadi /h(?:ello|i|ey)/ tidak akan meningkatkan performa.

  • Wildcard — Untuk alasan performa, Macie membatasi jumlah wildcard berulang. Misalnya, a*b*a* tidak akan dikompilasi di Macie.

  • Alternasi — Untuk menentukan lebih dari satu pola dalam satu daftar izinkan, Anda dapat menggunakan operator alternasi (|) untuk menggabungkan pola. Jika Anda melakukan ini, Macie menggunakan logika OR untuk menggabungkan pola dan membentuk pola baru. Misalnya, jika Anda menentukan(apple|orange), Macie mengenali apel dan oranye sebagai kecocokan dan mengabaikan kemunculan kedua kata tersebut. Jika Anda menggabungkan pola, pastikan untuk membatasi panjang keseluruhan ekspresi gabungan menjadi 512 karakter atau lebih sedikit.

Terakhir, saat Anda mengembangkan regex, rancang untuk mengakomodasi berbagai jenis file dan format penyimpanan. Macie menggunakan regex sebagai bagian dari kerangka ekstraksi dan analisis data yang lebih besar. Faktor kerangka kerja jenis file objek S3 atau format penyimpanan. Untuk data terstruktur, seperti data kolumnar dalam file CSV atau data berbasis rekaman dalam file JSON, Macie mengabaikan teks yang benar-benar cocok dengan pola hanya jika semua teks disimpan dalam satu bidang, sel, atau array. Persyaratan ini tidak berlaku untuk data terstruktur yang disimpan dalam file yang tidak terstruktur, seperti tabel dalam file Adobe Portable Document Format (.pdf). Untuk data yang tidak terstruktur, seperti teks dalam file.pdf, Macie mengabaikan teks yang benar-benar cocok dengan pola, termasuk teks yang mencakup beberapa baris atau halaman.

Contoh

Contoh berikut menunjukkan pola regex yang valid untuk beberapa skenario umum.

Alamat email

Jika Anda menggunakan pengenal data khusus untuk mendeteksi alamat email, Anda dapat mengabaikan alamat email yang dianggap tidak sensitif, seperti alamat email untuk organisasi Anda.

Untuk mengabaikan alamat email untuk domain tingkat kedua dan tingkat atas tertentu, Anda dapat menggunakan pola ini:

[a-zA-Z0-9_.+\\-]+@example\.com

Dimana contoh adalah nama domain tingkat kedua dan com adalah domain tingkat atas. Dalam hal ini, Macie mencocokkan dan mengabaikan alamat seperti johndoe@example.com dan john.doe@example.com.

Untuk mengabaikan alamat email untuk domain tertentu di domain tingkat atas generik (gTLD), seperti.com atau.gov, Anda dapat menggunakan pola ini:

[a-zA-Z0-9_.+\\-]+@example\.[a-zA-Z]{2,}

Di mana contoh adalah nama domain. Dalam hal ini, Macie mencocokkan dan mengabaikan alamat seperti johndoe@example.com, john.doe@example.gov, dan johndoe@example.edu.

Untuk mengabaikan alamat email untuk domain tertentu di salah satu domain tingkat atas kode negara (ccTLD), seperti.ca untuk Kanada atau .au untuk Australia, Anda dapat menggunakan pola ini:

[a-zA-Z0-9_.+\\-]+@example\.(ca|au)

Di mana contoh adalah nama domain dan ca dan au adalah ccTLD khusus untuk diabaikan. Dalam hal ini, Macie mencocokkan dan mengabaikan alamat seperti johndoe@example.ca dan john.doe@example.au.

Untuk mengabaikan alamat email untuk domain dan gTLD tertentu dan menyertakan domain tingkat ketiga dan keempat, Anda dapat menggunakan pola ini:

[a-zA-Z0-9_.+\\-]+@([a-zA-Z0-9-]+\.)?[a-zA-Z0-9-]+\.example\.com

Dimana contoh adalah nama domain dan com adalah gTLD. Dalam hal ini, Macie mencocokkan dan mengabaikan alamat seperti johndoe@www.example.com dan john.doe@www.team.example.com.

Nomor telepon

Macie menyediakan pengidentifikasi data terkelola yang dapat mendeteksi nomor telepon untuk beberapa negara dan wilayah. Untuk mengabaikan nomor telepon tertentu, seperti nomor bebas pulsa atau nomor telepon publik untuk organisasi Anda, Anda dapat menggunakan pola seperti berikut ini.

Untuk mengabaikan nomor telepon AS bebas pulsa yang menggunakan kode area 800 dan diformat sebagai (800) ###-####:

^\(?800\)?[ -]?\d{3}[ -]?\d{4}$

Untuk mengabaikan bebas pulsa, nomor telepon AS yang menggunakan kode area 888 dan diformat sebagai (888) ###-###:

^\(?888\)?[ -]?\d{3}[ -]?\d{4}$

Untuk mengabaikan 10 digit, nomor telepon Prancis yang menyertakan kode 33 negara dan diformat sebagai +33 ## ## ## ##:

^\+33 \d( \d\d){4}$

Untuk mengabaikan nomor telepon AS dan Kanada yang menggunakan area tertentu dan kode pertukaran, jangan sertakan kode negara, dan diformat sebagai (###) ###-####:

^\(?123\)?[ -]?555[ -]?\d{4}$

Di mana 123 adalah kode area dan 555 adalah kode pertukaran.

Untuk mengabaikan nomor telepon AS dan Kanada yang menggunakan area tertentu dan kode pertukaran, sertakan kode negara, dan diformat sebagai +1 (###) ###-####:

^\+1\(?123\)?[ -]?555[ -]?\d{4}$

Di mana 123 adalah kode area dan 555 adalah kode pertukaran.