Tentang pengayaan semantik otomatis - OpenSearch Layanan Amazon

Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.

Tentang pengayaan semantik otomatis

Saat membuat atau mengedit koleksi, Anda dapat mengonfigurasi pengayaan semantik otomatis, yang menyederhanakan implementasi dan kemampuan penelusuran semantik di Amazon Service. OpenSearch Pencarian semantik mengembalikan hasil kueri yang menggabungkan tidak hanya pencocokan kata kunci, tetapi maksud dan arti kontekstual dari pencarian pengguna. Misalnya, jika pengguna mencari “cara mengobati sakit kepala”, sistem pencarian semantik mungkin mengembalikan hasil berikut:

  • Obat migrain

  • Teknik manajemen nyeri

  • Over-the-counter pereda nyeri

  • Metode pereda sakit kepala alami

Sistem memahami maksud yang mendasarinya bahkan ketika frasa persis ini tidak ada dalam kueri asli.

Pengayaan semantik otomatis menawarkan manfaat berikut:

Implementasi yang disederhanakan

Anda tidak memerlukan keahlian pembelajaran mesin (ML) atau integrasi yang kompleks.

Proses otomatis

Pengayaan semantik terjadi secara otomatis selama konsumsi data.

Peningkatan relevansi pencarian

Pengayaan semantik meningkatkan kualitas dan akurasi kontekstual hasil pencarian.

Skalabilitas

Pengayaan semantik menerapkan pencarian semantik ke kumpulan data besar tanpa intervensi manual.

Cara kerjanya

Untuk memulai pengayaan semantik otomatis, Anda membuat atau mengedit koleksi dan menentukan bidang mana dalam data Anda yang memerlukan kemampuan pencarian semantik. Setelah Anda mengidentifikasi bidang untuk pencarian semantik, saat data memasuki OpenSearch Layanan, proses pengayaan semantik otomatis secara otomatis memperkaya bidang ini. Data yang diperkaya mendukung pencarian yang lebih cerdas dan sadar konteks.

catatan

Pertimbangkan faktor-faktor berikut saat menerapkan pengayaan semantik otomatis:

  • Overhead pemrosesan: Proses pengayaan dapat menambah waktu pemrosesan selama konsumsi.

  • Implikasi penyimpanan: Data yang diperkaya membutuhkan ruang penyimpanan tambahan.

  • Keterbatasan bahasa: Periksa apakah opsi multi-bahasa mendukung bahasa yang Anda butuhkan.

Pengayaan semantik otomatis untuk tanpa server menawarkan opsi bahasa berikut.

Opsi hanya bahasa Inggris
  • Dioptimalkan untuk konten bahasa Inggris

  • Ideal untuk aplikasi yang terutama berhubungan dengan teks bahasa Inggris

Opsi multi-bahasa
  • Mendukung bahasa berikut: Arab, Bengali, Mandarin, Inggris, Finlandia, Prancis, Hindi, Indonesia, Jepang, Korea, Persia, Rusia, Spanyol, Swahili, dan Telugu

  • Sempurna untuk beragam, konten internasional atau aplikasi multibahasa

Mengkonfigurasi izin untuk pengayaan semantik otomatis

Sebelum membuat indeks pengayaan semantik otomatis, Anda perlu mengonfigurasi izin yang diperlukan. Bagian ini menjelaskan izin yang diperlukan dan cara mengaturnya.

Izin kebijakan IAM

Gunakan kebijakan AWS Identity and Access Management (IAM) berikut ini untuk memberikan izin yang diperlukan untuk bekerja dengan pengayaan semantik otomatis:

JSON
{ "Version": "2012-10-17", "Statement": [ { "Sid": "AutomaticSemanticEnrichmentPermissions", "Effect": "Allow", "Action": [ "aoss:CreateIndex", "aoss:GetIndex", "aoss:UpdateIndex", "aoss:DeleteIndex", "aoss:APIAccessAll" ], "Resource": "*" } ] }
Izin kunci
  • aoss:*IndexIzin mengaktifkan manajemen indeks

  • aoss:APIAccessAllIzin memungkinkan operasi OpenSearch API

  • Untuk membatasi izin ke koleksi tertentu, ganti "Resource": "*" dengan ARN koleksi

Konfigurasikan izin akses data

Untuk menyiapkan indeks untuk pengayaan semantik otomatis, Anda harus memiliki kebijakan akses data yang sesuai yang memberikan izin untuk mengakses sumber daya indeks, pipeline, dan pengumpulan model. Untuk informasi selengkapnya tentang kebijakan akses data, lihatKontrol akses data untuk Amazon Tanpa OpenSearch Server. Untuk prosedur mengonfigurasi kebijakan akses data, lihatMembuat kebijakan akses data (konsol).

Izin akses data

[ { "Description": "Create index permission", "Rules": [ { "ResourceType": "index", "Resource": ["index/collection_name/*"], "Permission": [ "aoss:CreateIndex", "aoss:DescribeIndex", "aoss:UpdateIndex", "aoss:DeleteIndex" ] } ], "Principal": [ "arn:aws:iam::account_id:role/role_name" ] }, { "Description": "Create pipeline permission", "Rules": [ { "ResourceType": "collection", "Resource": ["collection/collection_name"], "Permission": [ "aoss:CreateCollectionItems", "aoss:DescribeCollectionItems" ] } ], "Principal": [ "arn:aws:iam::account_id:role/role_name" ] }, { "Description": "Create model permission", "Rules": [ { "ResourceType": "model", "Resource": ["model/collection_name/*"], "Permission": ["aoss:CreateMLResources"] } ], "Principal": [ "arn:aws:iam::account_id:role/role_name" ] }, ]

Izin akses jaringan

Untuk mengizinkan layanan APIs mengakses koleksi pribadi, Anda harus mengonfigurasi kebijakan jaringan yang mengizinkan akses yang diperlukan antara API layanan dan koleksi. Untuk informasi selengkapnya tentang kebijakan jaringan, lihat Akses jaringan untuk Amazon Tanpa OpenSearch Server.

[ { "Description":"Enable automatic semantic enrichment in a private collection", "Rules":[ { "ResourceType":"collection", "Resource":[ "collection/collection_name" ] } ], "AllowFromPublic":false, "SourceServices":[ "aoss.amazonaws.com" ], } ]
Untuk mengonfigurasi izin akses jaringan untuk koleksi pribadi
  1. Masuk ke konsol OpenSearch Layanan di https://console.aws.amazon.com/aos/rumah.

  2. Di navigasi kiri, pilih Kebijakan jaringan. Kemudian lakukan salah satu hal berikut:

    • Pilih nama kebijakan yang ada dan pilih Edit

    • Pilih Buat kebijakan jaringan dan konfigurasikan detail kebijakan

  3. Di area tipe Access, pilih Private (recommended), lalu pilih AWS Service Private Access.

  4. Di kolom pencarian, pilih Layanan, lalu pilih aoss.amazonaws.com.

  5. Di area Jenis sumber daya, pilih kotak Aktifkan akses ke OpenSearch titik akhir.

  6. Untuk koleksi Penelusuran, atau masukan istilah awalan tertentu, di kolom pencarian, pilih Nama Koleksi. Kemudian masukkan atau pilih nama koleksi untuk dikaitkan dengan kebijakan jaringan.

  7. Pilih Buat untuk kebijakan jaringan baru atau Perbarui untuk kebijakan jaringan yang ada.