Mengambil bagian - Amazon Kendra

Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.

Mengambil bagian

Anda dapat menggunakan RetrieveAPI sebagai retriever untuk sistem retrieval augmented generation (RAG).

Sistem RAG menggunakan kecerdasan buatan generatif untuk membangun aplikasi penjawab pertanyaan. Sistem RAG terdiri dari retriever dan large language models (LLM). Diberikan kueri, retriever mengidentifikasi potongan teks yang paling relevan dari kumpulan dokumen dan memasukkannya ke LLM untuk memberikan jawaban yang paling berguna. Kemudian, LLM menganalisis potongan atau bagian teks yang relevan dan menghasilkan respons komprehensif untuk kueri.

RetrieveAPI melihat potongan teks atau kutipan yang disebut sebagai bagian dan mengembalikan bagian atas yang paling relevan dengan kueri.

Seperti QueryAPI, Retrieve API juga mencari informasi yang relevan menggunakan pencarian semantik. Pencarian semantik memperhitungkan konteks permintaan pencarian, ditambah semua informasi yang tersedia dari dokumen yang diindeks. Namun, secara default, Query API hanya mengembalikan bagian kutipan hingga 100 kata token. Dengan Retrieve API, Anda dapat mengambil bagian yang lebih panjang hingga 200 kata token dan hingga 100 bagian yang relevan secara semantik. Ini tidak termasuk respons tipe tanya jawab atau FAQ dari indeks Anda. Bagian-bagian tersebut adalah kutipan teks yang dapat diekstraksi secara semantik dari beberapa dokumen dan beberapa bagian dari dokumen yang sama. Jika dalam kasus ekstrim dokumen Anda menghasilkan nol bagian menggunakan Retrieve API, Anda dapat menggunakan Query API dan jenis responsnya.

Anda juga dapat melakukan hal berikut dengan Retrieve API:

  • Mengesampingkan peningkatan pada tingkat indeks

  • Filter berdasarkan bidang atau atribut dokumen

  • Filter berdasarkan akses pengguna atau grup mereka ke dokumen

  • Lihat ember skor kepercayaan untuk hasil bagian yang diambil. Ember kepercayaan memberikan peringkat relatif yang menunjukkan seberapa yakin Amazon Kendra bahwa respons tersebut relevan dengan kueri.

    catatan

    Bucket skor kepercayaan saat ini hanya tersedia untuk bahasa Inggris.

Anda juga dapat menyertakan bidang tertentu dalam respons yang mungkin memberikan informasi tambahan yang berguna.

RetrieveAPI saat ini tidak mendukung semua fitur yang didukung oleh Query API. Fitur berikut tidak didukung: kueri menggunakan sintaks kueri lanjutan, koreksi ejaan yang disarankan untuk kueri, faset, saran kueri untuk melengkapi kueri penelusuran secara otomatis, dan pembelajaran inkremental. Perhatikan bahwa tidak semua fitur berlaku untuk Retrieve API. Setiap rilis Retrieve API di masa mendatang akan didokumentasikan dalam panduan ini.

RetrieveAPI membagikan jumlah unit kapasitas kueri yang Anda tetapkan untuk indeks Anda. Untuk informasi selengkapnya tentang apa yang disertakan dalam unit kapasitas tunggal dan kapasitas dasar default untuk indeks, lihat Menyesuaikan kapasitas.

catatan

Anda tidak dapat menambahkan kapasitas jika Anda menggunakan Edisi Amazon Kendra Pengembang; Anda hanya dapat menambahkan kapasitas saat menggunakan Amazon Kendra Enterprise Edition. Untuk informasi selengkapnya tentang apa yang disertakan dalam Edisi Pengembang dan Perusahaan, lihat Amazon Kendra Edisi.

Berikut ini adalah contoh penggunaan Retrieve API untuk mengambil 100 bagian paling relevan dari dokumen dalam indeks untuk kueri "how does amazon kendra work?"

Python
import boto3 import pprint kendra = boto3.client("kendra") # Provide the index ID index_id = "index-id" # Provide the query text query = "how does amazon kendra work?" # You can retrieve up to 100 relevant passages # You can paginate 100 passages across 10 pages, for example page_size = 10 page_number = 10 result = kendra.retrieve( IndexId = index_id, QueryText = query, PageSize = page_size, PageNumber = page_number) print("\nRetrieved passage results for query: " + query + "\n") for retrieve_result in result["ResultItems"]: print("-------------------") print("Title: " + str(retrieve_result["DocumentTitle"])) print("URI: " + str(retrieve_result["DocumentURI"])) print("Passage content: " + str(retrieve_result["Content"])) print("------------------\n\n")
Java
package com.amazonaws.kendra; import software.amazon.awssdk.services.kendra.KendraClient; import software.amazon.awssdk.services.kendra.model.RetrieveRequest; import software.amazon.awssdk.services.kendra.model.RetrieveResult; import software.amazon.awssdk.services.kendra.model.RetrieveResultItem; public class RetrievePassageExample { public static void main(String[] args) { KendraClient kendra = KendraClient.builder().build(); String indxId = "index-id"; String query = "how does amazon kendra work?"; Integer pgSize = 10; Integer pgNumber = 10; RetrieveRequest retrieveRequest = retrieveRequest .builder() .indexId(indxId) .queryText(query) .pageSize(pgSize) .pageNumber(pgNumber) .build(); RetrieveResult retrieveResult = kendra.retrieve(retrieveRequest); System.out.println(String.format("\nRetrieved passage results for query: %s", query)); for(RetrieveResultItem item: retrieveResult.resultItems()) { System.out.println("----------------------"); System.out.println(String.format("Title: %s", documentTitle)); System.out.println(String.format("URI: %s", documentURI)); System.out.println(String.format("Passage content: %s", content)); System.out.println("-----------------------\n"); } } }