Memetakan bidang sumber data - Amazon Kendra

Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.

Memetakan bidang sumber data

Amazon Kendra konektor sumber data dapat memetakan bidang dokumen atau konten dari sumber data Anda ke bidang dalam Amazon Kendra indeks Anda. Secara default, setiap konektor dirancang untuk merayapi bidang sumber data tertentu. Bidang sumber data default dan propertinya tidak dapat diubah atau disesuaikan. Di Amazon Kendra konsol, bidang default dan properti bidang default yang tidak dapat diedit berwarna abu-abu.

Amazon Kendra konektor juga memungkinkan Anda untuk memetakan dokumen khusus atau bidang konten dari sumber data Anda ke bidang khusus dalam indeks Anda. Misalnya, jika Anda memiliki bidang di sumber data yang disebut “dept” yang berisi informasi departemen untuk dokumen, Anda dapat memetakannya ke bidang indeks yang disebut “Departemen”. Dengan begitu, Anda dapat menggunakan bidang saat menanyakan dokumen.

Anda juga dapat memetakan bidang yang Amazon Kendra dipesan atau umum seperti_created_at. Jika sumber data Anda memiliki bidang yang disebut “creation_date”, Anda dapat memetakannya ke bidang Amazon Kendra cadangan setara yang disebut. _created_at Untuk informasi selengkapnya tentang bidang yang Amazon Kendra dicadangkan, lihat Atribut atau bidang dokumen.

Anda dapat memetakan bidang untuk sebagian besar sumber data. Anda dapat membuat pemetaan bidang untuk sumber data berikut:

  • Manajer Pengalaman Adobe

  • Alfresco

  • Aurora (MySQL)

  • Aurora (PostgreSQL)

  • Amazon FSx (Jendela)

  • Amazon FSx (NetApp ONTAP)

  • Amazon RDS/Aurora

  • Amazon RDS (Microsoft SQL Server)

  • Amazon RDS (MySQL)

  • Amazon RDS (Oracle)

  • Amazon RDS (PostgreSQL)

  • Amazon Kendra Perayap Web

  • Amazon WorkDocs

  • Kotak

  • Confluence

  • Dropbox

  • Drupal

  • GitHub

  • Google Workspace Drives

  • Gmail

  • IBM DB2

  • Jira

  • Microsoft Exchange

  • Microsoft OneDrive

  • Microsoft SharePoint

  • Tim Microsoft

  • Microsoft SQL Server

  • Microsoft Yammer

  • MySQL

  • Oracle Database

  • PostgreSQL

  • Menyindir

  • Salesforce

  • ServiceNow

  • Kendur

  • Zendesk

Jika Anda menyimpan dokumen di bucket S3, atau sumber data S3, Anda menentukan bidang menggunakan file metadata JSON. Untuk informasi selengkapnya, lihat konektor sumber data S3.

Memetakan bidang sumber data ke bidang indeks memerlukan tiga langkah:

  1. Buat indeks. Untuk informasi lebih lanjut, lihat Membuat indeks.

  2. Perbarui indeks untuk menambahkan bidang.

  3. Buat sumber data dan sertakan pemetaan bidang untuk memetakan bidang yang dicadangkan dan bidang khusus apa pun untuk Amazon Kendra mengindeks bidang.

Untuk memperbarui indeks untuk menambahkan bidang kustom, gunakan konsol untuk mengedit pemetaan bidang sumber data dan menambahkan bidang kustom atau menggunakan API. UpdateIndex Anda dapat menambahkan total 500 bidang kustom ke indeks Anda.

Untuk sumber data basis data, jika nama kolom basis data cocok dengan nama bidang terpesan, bidang dan kolom akan otomatis dipetakan.

Dengan UpdateIndexAPI, Anda menambahkan bidang cadangan dan kustom menggunakanDocumentMetadataConfigurationUpdates.

Contoh JSON berikut digunakan DocumentMetadataConfigurationUpdates untuk menambahkan bidang yang disebut “Departemen” ke indeks.

"DocumentmetadataConfigurationUpdates": [ { "Name": "Department", "Type": "STRING_VALUE" } ]

Saat Anda membuat bidang, Anda memiliki opsi untuk mengatur bagaimana bidang tersebut digunakan untuk pencarian. Anda dapat memilih dari opsi berikut:

  • Displayable —Menentukan apakah bidang dikembalikan dalam respons kueri. Default-nya adalah true.

  • Facetable —Menunjukkan bahwa bidang dapat digunakan untuk membuat faset. Default-nya adalah false.

  • Dapat dicari —Menentukan apakah bidang digunakan dalam pencarian. Secara default adalah true untuk bidang string dan false untuk bidang nomor dan tanggal.

  • Sortable —Menunjukkan bahwa bidang dapat digunakan untuk mengurutkan respons dari kueri. Hanya dapat diatur untuk bidang tanggal, angka, dan string. Tidak dapat diatur untuk bidang daftar string.

Contoh JSON berikut digunakan DocumentMetadataConfigurationUpdates untuk menambahkan bidang yang disebut “Departemen” ke indeks dan menandainya sebagai facetable.

"DocumentMetadataConfigurationUpdates": [ { "Name": "Department", "Type": "STRING_VALUE", "Search": { "Facetable": true } } ]

Menggunakan bidang dokumen yang Amazon Kendra dicadangkan atau umum

Dengan UpdateIndex API, Anda dapat membuat kolom cadangan atau umum menggunakan DocumentMetadataConfigurationUpdates dan menentukan nama bidang indeks Amazon Kendra cadangan untuk dipetakan ke atribut/nama bidang dokumen yang setara. Anda juga dapat membuat bidang khusus. Jika Anda menggunakan konektor sumber data, sebagian besar menyertakan pemetaan bidang yang memetakan bidang dokumen sumber data Anda ke bidang Amazon Kendra indeks. Jika Anda menggunakan konsol, Anda memperbarui bidang dengan memilih sumber data, memilih tindakan edit, dan kemudian melanjutkan di sebelah bagian pemetaan bidang untuk mengonfigurasi sumber data.

Anda dapat mengonfigurasi Search objek untuk menetapkan bidang sebagai dapat ditampilkan, facetable, dapat dicari, dan dapat diurutkan. Anda dapat mengonfigurasi Relevance objek untuk mengatur urutan peringkat bidang, durasi peningkatan, atau periode waktu untuk diterapkan pada peningkatan, kesegaran, nilai kepentingan, dan nilai kepentingan yang dipetakan ke nilai bidang tertentu. Jika Anda menggunakan konsol, Anda dapat mengatur pengaturan pencarian untuk bidang dengan memilih opsi facet di menu navigasi. Untuk mengatur penyetelan relevansi, pilih opsi untuk mencari indeks Anda di menu navigasi, masukkan kueri, dan gunakan opsi panel samping untuk menyetel relevansi pencarian. Anda tidak dapat mengubah jenis bidang setelah Anda membuat bidang.

Amazon Kendra memiliki bidang dokumen cadangan atau umum berikut yang dapat Anda gunakan:

  • _authorsDaftar satu atau lebih penulis yang bertanggung jawab atas isi dokumen.

  • _categorySebuah kategori yang menempatkan dokumen dalam kelompok tertentu.

  • _created_at—Tanggal dan waktu dalam format ISO 8601 bahwa dokumen itu dibuat. Misalnya, 2012-03-25T 12:30:10 +01:00 adalah format tanggal-waktu ISO 8601 untuk 25 Maret 2012 pukul 12:30 (ditambah 10 detik) di Waktu Eropa Tengah.

  • _data_source_id—Pengidentifikasi sumber data yang berisi dokumen.

  • _document_body—Isi dokumen.

  • _document_id—Pengidentifikasi unik untuk dokumen.

  • _document_title—Judul dokumen.

  • _excerpt_page_number—Nomor halaman dalam file PDF tempat kutipan dokumen muncul. Jika indeks Anda dibuat sebelum 8 September 2020, Anda harus mengindeks ulang dokumen sebelum dapat menggunakan atribut ini.

  • _faq_id—Jika ini adalah dokumen tipe tanya jawab (FAQ), pengenal unik untuk FAQ.

  • _file_type—Jenis file dokumen, seperti pdf atau doc.

  • _last_updated_atTanggal dan waktu dalam format ISO 8601 bahwa dokumen terakhir diperbarui. Misalnya, 2012-03-25T 12:30:10 +01:00 adalah format tanggal-waktu ISO 8601 untuk 25 Maret 2012 pukul 12:30 (ditambah 10 detik) di Waktu Eropa Tengah.

  • _source_uri—URI tempat dokumen tersedia. Misalnya, URI dokumen di situs web perusahaan.

  • _version—Pengidentifikasi untuk versi dokumen tertentu.

  • _view_count—Berapa kali dokumen telah dilihat.

  • _language_code(String) —Kode untuk bahasa yang berlaku untuk dokumen. Ini default ke bahasa Inggris jika Anda tidak menentukan bahasa. Untuk informasi selengkapnya tentang bahasa yang didukung, termasuk kodenya, lihat Menambahkan dokumen dalam bahasa selain bahasa Inggris.

Untuk bidang kustom, Anda membuat bidang ini menggunakan DocumentMetadataConfigurationUpdates UpdateIndex API, seperti yang Anda lakukan saat membuat bidang cadangan atau umum. Anda harus mengatur tipe data yang sesuai untuk bidang kustom Anda. Jika Anda menggunakan konsol, Anda memperbarui bidang dengan memilih sumber data, memilih tindakan edit, dan kemudian melanjutkan di sebelah bagian pemetaan bidang untuk mengonfigurasi sumber data. Beberapa sumber data tidak mendukung penambahan bidang baru atau bidang khusus. Anda tidak dapat mengubah jenis bidang setelah Anda membuat bidang.

Berikut ini adalah jenis yang dapat Anda atur untuk bidang khusus:

  • Tanggal

  • Angka

  • String

  • Daftar string

Jika Anda menambahkan dokumen ke indeks menggunakan BatchPutDocumentAPI, Attributes daftar bidang/atribut dokumen Anda dan Anda membuat bidang menggunakan objek. DocumentAttribute

Untuk dokumen yang diindeks dari sumber Amazon S3 data, Anda membuat bidang menggunakan file metadata JSON yang menyertakan informasi bidang.

Jika Anda menggunakan database yang didukung sebagai sumber data, Anda dapat mengonfigurasi bidang menggunakan opsi pemetaan bidang.