Gmail - Amazon Kendra

Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.

Gmail

Gmail adalah klien email yang dikembangkan oleh Google di mana Anda dapat mengirim pesan email dengan lampiran file. Pesan Gmail dapat diurutkan dan disimpan di dalam kotak masuk email Anda menggunakan folder dan label. Anda dapat menggunakan Amazon Kendra untuk mengindeks pesan email dan lampiran pesan Anda. Anda juga dapat mengonfigurasi Amazon Kendra untuk menyertakan atau mengecualikan pesan email tertentu, lampiran pesan, dan label untuk pengindeksan.

Anda dapat terhubung Amazon Kendra ke sumber data Gmail Anda menggunakan Amazon Kendra konsol dan TemplateConfigurationAPI.

Untuk mengatasi masalah konektor sumber data Amazon Kendra Gmail, lihat. Mengatasi masalah sumber data

Fitur yang didukung

  • Pemetaan lapangan

  • Kontrol akses pengguna

  • Filter inklusi/pengecualian

  • Sinkronisasi konten penuh dan tambahan

  • Cloud privat virtual (VPC)

Prasyarat

Sebelum Anda dapat menggunakan Amazon Kendra untuk mengindeks sumber data Gmail Anda, buat perubahan ini di Gmail dan AWS akun Anda.

Di Gmail, pastikan Anda memiliki:

  • Membuat akun admin Google Cloud Platform dan telah membuat proyek Google Cloud.

  • Diaktifkan API Gmail dan Admin SDK API di akun admin Anda.

  • Membuat akun layanan dan mengunduh kunci pribadi JSON untuk Gmail Anda. Untuk informasi tentang cara membuat dan mengakses kunci pribadi Anda, lihat dokumentasi Google Cloud tentang cara membuat kunci akun layanan dan kredensyal akun Layanan.

  • Menyalin email akun admin Anda, email akun layanan Anda, dan kunci pribadi Anda untuk digunakan sebagai kredensyal otentikasi Anda.

    catatan

    Kami menyarankan Anda secara teratur menyegarkan atau memutar kredensil dan rahasia Anda. Berikan hanya tingkat akses yang diperlukan untuk keamanan Anda sendiri. Kami tidak menyarankan Anda menggunakan kembali kredensyal dan rahasia di seluruh sumber data, dan konektor versi 1.0 dan 2.0 (jika berlaku).

  • Menambahkan cakupan Oauth berikut (menggunakan peran admin) untuk pengguna Anda dan direktori bersama yang ingin Anda indeks:

    • https://www.googleapis.com/auth/admin.directory.user.readonly

    • https://www.googleapis.com/auth/gmail.readonly

  • Memeriksa setiap dokumen unik di Gmail dan di seluruh sumber data lain yang Anda rencanakan untuk digunakan untuk indeks yang sama. Setiap sumber data yang ingin Anda gunakan untuk indeks tidak boleh berisi dokumen yang sama di seluruh sumber data. ID dokumen bersifat global untuk indeks dan harus unik per indeks.

Di dalam Anda Akun AWS, pastikan Anda memiliki:

  • Membuat Amazon Kendra indeks dan, jika menggunakan API, mencatat ID indeks.

  • Membuat IAM peran untuk sumber data Anda dan, jika menggunakan API, catat ARN peran tersebut IAM .

    catatan

    Jika Anda mengubah jenis otentikasi dan kredensyal, Anda harus memperbarui IAM peran Anda untuk mengakses ID rahasia yang benar AWS Secrets Manager .

  • Menyimpan kredensyal otentikasi Gmail Anda AWS Secrets Manager secara rahasia dan, jika menggunakan API, catat ARN rahasianya.

    catatan

    Kami menyarankan Anda secara teratur menyegarkan atau memutar kredensil dan rahasia Anda. Berikan hanya tingkat akses yang diperlukan untuk keamanan Anda sendiri. Kami tidak menyarankan Anda menggunakan kembali kredensyal dan rahasia di seluruh sumber data, dan konektor versi 1.0 dan 2.0 (jika berlaku).

Jika Anda tidak memiliki IAM peran atau rahasia yang ada, Anda dapat menggunakan konsol untuk membuat IAM peran dan Secrets Manager rahasia baru saat Anda menghubungkan sumber data Gmail Anda Amazon Kendra. Jika Anda menggunakan API, Anda harus memberikan ARN IAM peran dan Secrets Manager rahasia yang ada, dan ID indeks.

Instruksi koneksi

Untuk terhubung Amazon Kendra ke sumber data Gmail Anda, Anda harus memberikan detail kredensyal Gmail Anda sehingga Amazon Kendra dapat mengakses data Anda. Jika Anda belum mengkonfigurasi Gmail untuk Amazon Kendra, lihatPrasyarat.

Console

Untuk terhubung Amazon Kendra ke Gmail

  1. Masuk ke AWS Management Console dan buka Amazon Kendra konsol.

  2. Dari panel navigasi kiri, pilih Indeks dan kemudian pilih indeks yang ingin Anda gunakan dari daftar indeks.

    catatan

    Anda dapat memilih untuk mengonfigurasi atau mengedit pengaturan kontrol akses Pengguna Anda di bawah Pengaturan indeks.

  3. Pada halaman Memulai, pilih Tambahkan sumber data.

  4. Pada halaman Tambah sumber data, pilih konektor Gmail, lalu pilih Tambah konektor. Jika menggunakan versi 2 (jika ada), pilih konektor Gmail dengan tag “V2.0".

  5. Pada halaman Tentukan detail sumber data, masukkan informasi berikut:

    1. Di Nama dan deskripsi, untuk Nama sumber data —Masukkan nama untuk sumber data Anda. Anda dapat memasukkan tanda hubung tetapi bukan spasi.

    2. (Opsional) Deskripsi —Masukkan deskripsi opsional untuk sumber data Anda.

    3. Dalam Bahasa default —Pilih bahasa untuk memfilter dokumen Anda untuk indeks. Kecuali Anda menentukan sebaliknya, bahasa default ke bahasa Inggris. Bahasa yang ditentukan dalam metadata dokumen mengesampingkan bahasa yang dipilih.

    4. Di Tag, untuk Tambahkan tag baru —Sertakan tag opsional untuk mencari dan memfilter sumber daya Anda atau melacak AWS biaya Anda.

    5. Pilih Selanjutnya.

  6. Pada halaman Tentukan akses dan keamanan, masukkan informasi berikut:

    1. Otorisasi — Aktifkan atau nonaktifkan informasi daftar kontrol akses (ACL) untuk dokumen Anda, jika Anda memiliki ACL dan ingin menggunakannya untuk kontrol akses. ACL menentukan dokumen mana yang dapat diakses pengguna dan grup. Informasi ACL digunakan untuk memfilter hasil pencarian berdasarkan pengguna atau akses grup mereka ke dokumen. Untuk informasi selengkapnya, lihat Pemfilteran konteks pengguna.

    2. Dalam Otentikasi untuk AWS Secrets Manager rahasia —Pilih rahasia yang ada atau buat Secrets Manager rahasia baru untuk menyimpan kredensi otentikasi Gmail Anda. Jika Anda memilih untuk membuat rahasia baru, jendela AWS Secrets Manager rahasia terbuka.

      1. Masukkan informasi berikut di jendela Buat AWS Secrets Manager rahasia:

        1. Nama Rahasia — Nama untuk rahasiamu.

        2. Email klien —Email klien yang Anda salin dari akun layanan Google Anda.

        3. Email akun admin —Email akun admin yang ingin Anda gunakan.

        4. Kunci pribadi —Kunci pribadi yang Anda salin dari akun layanan Google Anda.

        5. Simpan dan tambahkan rahasia Anda.

    3. Virtual Private Cloud (VPC) —Anda dapat memilih untuk menggunakan VPC. Jika demikian, Anda harus menambahkan Subnet dan grup keamanan VPC.

    4. IAM peran —Pilih peran yang ada atau buat IAM IAM peran baru untuk mengakses kredensi repositori dan mengindeks konten Anda.

      catatan

      IAM peran yang digunakan untuk indeks tidak dapat digunakan untuk sumber data. Jika Anda tidak yakin apakah peran yang ada digunakan untuk indeks atau FAQ, pilih Buat peran baru untuk menghindari kesalahan.

    5. Pilih Selanjutnya.

  7. Pada halaman Konfigurasi pengaturan sinkronisasi, masukkan informasi berikut:

    1. Untuk tipe Entitas —Pilih untuk menyinkronkan lampiran pesan.

    2. (Opsional) Untuk konfigurasi tambahan, masukkan informasi berikut:

      1. Rentang tanggal —Masukkan rentang tanggal untuk menentukan tanggal mulai dan akhir email yang ingin dirayapi.

      2. Domain email —Sertakan atau kecualikan email tertentu berdasarkan domain email “ke”, “dari”, “cc”, dan “bcc”.

      3. Kata kunci dalam subjek —Sertakan atau kecualikan email berdasarkan kata kunci dalam subjek email mereka.

        catatan

        Anda juga dapat memilih untuk menyertakan dokumen apa pun yang cocok dengan semua kata kunci subjek yang telah Anda masukkan.

      4. Label —Tambahkan pola ekspresi reguler untuk menyertakan atau mengecualikan label email tertentu.

      5. Lampiran —Tambahkan pola ekspresi reguler untuk menyertakan atau mengecualikan lampiran email tertentu.

    3. Mode sinkronisasi —Pilih cara Anda ingin memperbarui indeks saat konten sumber data Anda berubah. Saat Anda menyinkronkan sumber data Amazon Kendra untuk pertama kalinya, semua konten dirayapi dan diindeks secara default. Anda harus menjalankan sinkronisasi penuh data Anda jika sinkronisasi awal Anda gagal, bahkan jika Anda tidak memilih sinkronisasi penuh sebagai opsi mode sinkronisasi Anda.

      • Sinkronisasi penuh: Indeks baru semua konten, ganti konten yang ada setiap kali sumber data Anda disinkronkan dengan indeks Anda.

      • Sinkronisasi baru, dimodifikasi, dihapus: Indeks hanya konten baru, dimodifikasi, dan dihapus setiap kali sumber data Anda disinkronkan dengan indeks Anda. Amazon Kendra dapat menggunakan mekanisme sumber data Anda untuk melacak perubahan konten dan mengindeks konten yang berubah sejak sinkronisasi terakhir.

      penting

      Karena tidak ada API untuk memperbarui pesan Gmail yang dihapus secara permanen, sinkronisasi konten baru, dimodifikasi, atau dihapus:

      • Tidak akan menghapus pesan yang dihapus secara permanen dari Gmail dari Amazon Kendra indeks Anda

      • Tidak akan menyinkronkan perubahan pada label email Gmail

      Untuk menyinkronkan perubahan label sumber data Gmail dan pesan email yang dihapus secara permanen ke Amazon Kendra indeks, Anda harus menjalankan crawl penuh secara berkala.

    4. Di Jadwal lari Sinkronisasi, untuk Frekuensi —Pilih seberapa sering menyinkronkan konten sumber data Anda dan memperbarui indeks Anda.

    5. Pilih Selanjutnya.

  8. Pada halaman Setel pemetaan bidang, masukkan informasi berikut:

    1. Bidang sumber data default —Pilih dari bidang sumber data default yang Amazon Kendra dihasilkan yang ingin Anda petakan ke indeks Anda.

      catatan

      Amazon Kendra Konektor sumber data Gmail tidak mendukung pembuatan bidang indeks khusus karena keterbatasan API.

    2. Pilih Selanjutnya.

  9. Pada halaman Tinjau dan buat, periksa apakah informasi yang Anda masukkan sudah benar dan kemudian pilih Tambahkan sumber data. Anda juga dapat memilih untuk mengedit informasi Anda dari halaman ini. Sumber data Anda akan muncul di halaman Sumber data setelah sumber data berhasil ditambahkan.

API

Untuk terhubung Amazon Kendra ke Gmail

Anda harus menentukan JSON dari skema sumber data menggunakan API. TemplateConfiguration Anda harus memberikan informasi berikut ini:

  • Sumber data —Tentukan tipe sumber data seperti GMAIL saat Anda menggunakan skema TemplateConfigurationJSON. Juga tentukan sumber data seperti TEMPLATE saat Anda memanggil CreateDataSourceAPI.

  • Mode sinkronisasi —Tentukan cara Amazon Kendra memperbarui indeks Anda saat konten sumber data Anda berubah. Saat Anda menyinkronkan sumber data Amazon Kendra untuk pertama kalinya, semua konten dirayapi dan diindeks secara default. Anda harus menjalankan sinkronisasi penuh data Anda jika sinkronisasi awal Anda gagal, bahkan jika Anda tidak memilih sinkronisasi penuh sebagai opsi mode sinkronisasi Anda. Anda dapat memilih antara:

    • FORCED_FULL_CRAWLuntuk mengindeks semua konten baru, mengganti konten yang ada setiap kali sumber data Anda disinkronkan dengan indeks Anda.

    • FULL_CRAWLuntuk mengindeks hanya konten baru, dimodifikasi, dan dihapus setiap kali sumber data Anda disinkronkan dengan indeks Anda. Amazon Kendra dapat menggunakan mekanisme sumber data Anda untuk melacak perubahan konten dan mengindeks konten yang berubah sejak sinkronisasi terakhir.

    penting

    Karena tidak ada API untuk memperbarui pesan Gmail yang dihapus secara permanen, sinkronisasi konten baru, dimodifikasi, atau dihapus:

    • Tidak akan menghapus pesan yang dihapus secara permanen dari Gmail dari Amazon Kendra indeks Anda

    • Tidak akan menyinkronkan perubahan pada label email Gmail

    Untuk menyinkronkan perubahan label sumber data Gmail dan pesan email yang dihapus secara permanen ke Amazon Kendra indeks, Anda harus menjalankan crawl penuh secara berkala.

  • Rahasia Nama Sumber Daya Amazon (ARN) —Berikan Nama Sumber Daya Amazon (ARN) Secrets Manager rahasia yang berisi kredensyal otentikasi untuk akun Gmail Anda. Rahasianya disimpan dalam struktur JSON dengan kunci berikut:

    { "adminAccountEmailId": "service account email", "clientEmailId": "user account email", "privateKey": "private key" }
  • IAM peran —Tentukan RoleArn kapan Anda menelepon CreateDataSource untuk memberikan IAM peran dengan izin untuk mengakses Secrets Manager rahasia Anda dan memanggil API publik yang diperlukan untuk konektor Gmail dan. Amazon Kendra Untuk informasi selengkapnya, lihat IAM peran untuk sumber data Gmail.

Anda juga dapat menambahkan fitur opsional berikut:

  • Virtual Private Cloud (VPC) VpcConfiguration —Tentukan kapan Anda menelepon. CreateDataSource Untuk informasi selengkapnya, lihat Mengkonfigurasi Amazon Kendra untuk menggunakan Amazon VPC.

  • Filter inklusi dan pengecualian —Tentukan apakah akan menyertakan atau mengecualikan email “ke”, “dari”, “cc”, “bcc” tertentu.

    catatan

    Sebagian besar sumber data menggunakan pola ekspresi reguler, yang merupakan pola inklusi atau pengecualian yang disebut sebagai filter. Jika Anda menentukan filter inklusi, hanya konten yang cocok dengan filter inklusi yang diindeks. Dokumen apa pun yang tidak cocok dengan filter inklusi tidak diindeks. Jika Anda menentukan filter inklusi dan pengecualian, dokumen yang cocok dengan filter pengecualian tidak akan diindeks, meskipun sesuai dengan filter inklusi.

  • Pemfilteran konteks pengguna dan kontrol akses —Amazon Kendra meng-crawl daftar kontrol akses (ACL) untuk dokumen Anda, jika Anda memiliki ACL untuk dokumen Anda. Informasi ACL digunakan untuk memfilter hasil pencarian berdasarkan pengguna atau akses grup mereka ke dokumen. Untuk informasi selengkapnya, lihat Pemfilteran konteks pengguna.

  • Pemetaan bidang —Pilih untuk memetakan bidang sumber data Gmail Anda ke bidang indeks Anda Amazon Kendra . Untuk informasi lebih lanjut, lihat Memetakan bidang sumber data.

    catatan

    Bidang badan dokumen atau badan dokumen yang setara untuk dokumen Anda diperlukan Amazon Kendra untuk mencari dokumen Anda. Anda harus memetakan nama bidang badan dokumen Anda di sumber data Anda ke nama bidang indeks_document_body. Semua kolom lain bersifat opsional.

    catatan

    Amazon Kendra Konektor sumber data Gmail tidak mendukung pembuatan bidang indeks khusus karena keterbatasan API.

Untuk daftar kunci JSON penting lainnya untuk dikonfigurasi, lihat skema Gmail template.

Pelajari selengkapnya

Untuk mempelajari lebih lanjut tentang mengintegrasikan Amazon Kendra dengan sumber data Gmail Anda, lihat:

Catatan

  • Karena tidak ada API untuk memperbarui pesan Gmail yang dihapus secara permanen, sinkronisasi kontenFULL_CRAWL/Baru, dimodifikasi, atau dihapus:

    • Tidak akan menghapus pesan yang dihapus secara permanen dari Gmail dari Amazon Kendra indeks Anda

    • Tidak akan menyinkronkan perubahan pada label email Gmail

    Untuk menyinkronkan perubahan label sumber data Gmail dan pesan email yang dihapus secara permanen ke Amazon Kendra indeks, Anda harus menjalankan crawl penuh secara berkala.

  • Amazon Kendra Konektor sumber data Gmail tidak mendukung pembuatan bidang indeks khusus karena keterbatasan API.