Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.
Mengambil bagian
Anda dapat menggunakan RetrieveAPIsebagai retriever untuk sistem augmented generation () RAG pengambilan.
RAGsistem menggunakan kecerdasan buatan generatif untuk membangun aplikasi penjawab pertanyaan. RAGsistem terdiri dari retriever dan model bahasa besar (LLM). Diberikan kueri, retriever mengidentifikasi potongan teks yang paling relevan dari kumpulan dokumen dan mengumpankannya ke untuk memberikan jawaban yang paling bergunaLLM. Kemudian, LLM menganalisis potongan atau bagian teks yang relevan dan menghasilkan respons komprehensif untuk kueri.
Retrieve
APIMelihat potongan teks atau kutipan yang disebut sebagai bagian dan mengembalikan bagian atas yang paling relevan dengan kueri.
Seperti QueryAPI, Retrieve
API juga mencari informasi yang relevan. Pengambilan informasi Retrieve API memperhitungkan konteks kueri, dan semua informasi yang tersedia dari dokumen yang diindeks. Namun, secara default, Query
API satu-satunya mengembalikan bagian kutipan hingga 100 kata token. Dengan Retrieve
API, Anda dapat mengambil bagian yang lebih panjang hingga 200 kata token dan hingga 100 bagian yang relevan secara semantik. Ini tidak termasuk jawaban pertanyaan atau FAQ jenis tanggapan dari indeks Anda. Bagian, juga disebut potongan, adalah kutipan teks yang dapat diekstraksi secara semantik dari beberapa dokumen dan beberapa bagian dari dokumen yang sama. Indeks GenAI Enterprise Edition Kendra menawarkan hasil akurasi tinggi untuk pengambilan, menggunakan pencarian hibrida melalui indeks vektor dan kata kunci bersama dengan peringkat berdasarkan model pembelajaran mendalam.
Anda juga dapat melakukan hal berikut dengan Retrieve
API:
-
Mengesampingkan peningkatan pada tingkat indeks
-
Filter berdasarkan bidang atau atribut dokumen
-
Filter berdasarkan akses pengguna atau grup mereka ke dokumen
-
Lihat ember skor kepercayaan untuk hasil bagian yang diambil. Ember kepercayaan memberikan peringkat relatif yang menunjukkan seberapa yakin Amazon Kendra bahwa respons tersebut relevan dengan kueri.
catatan
Bucket skor kepercayaan saat ini hanya tersedia untuk bahasa Inggris.
Anda juga dapat menyertakan bidang tertentu dalam respons yang mungkin memberikan informasi tambahan yang berguna.
Retrieve
APISaat ini tidak mendukung fitur berikut: kueri menggunakan sintaks kueri lanjutan, koreksi ejaan yang disarankan untuk kueri, faset, saran kueri untuk melengkapi kueri penelusuran secara otomatis, dan pembelajaran tambahan. Setiap API kueri pengambilan tidak akan muncul di dasbor analitik.
Retrieve
APIBerbagi jumlah unit kapasitas kueri yang Anda tetapkan untuk indeks Anda. Untuk informasi selengkapnya tentang apa yang disertakan dalam unit kapasitas tunggal dan kapasitas dasar default untuk indeks, lihat Menyesuaikan kapasitas.
catatan
Anda tidak dapat menambahkan kapasitas jika Anda menggunakan Edisi Amazon Kendra Pengembang; Anda hanya dapat menambahkan kapasitas saat menggunakan Amazon Kendra Enterprise Edition. Untuk informasi selengkapnya tentang apa yang disertakan dalam Edisi Pengembang dan Perusahaan, lihat Amazon Kendra Edisi.
Berikut ini adalah contoh penggunaan Retrieve
API untuk mengambil 100 bagian paling relevan dari dokumen dalam indeks untuk kueri "how does amazon kendra work?"
import boto3
import pprint
kendra = boto3.client("kendra")
# Provide the index ID
index_id = "index-id"
# Provide the query text
query = "how does amazon kendra work?"
# You can retrieve up to 100 relevant passages
# You can paginate 100 passages across 10 pages, for example
page_size = 10
page_number = 10
result = kendra.retrieve(
IndexId = index_id,
QueryText = query,
PageSize = page_size,
PageNumber = page_number)
print("\nRetrieved passage results for query: " + query + "\n")
for retrieve_result in result["ResultItems"]:
print("-------------------")
print("Title: " + str(retrieve_result["DocumentTitle"]))
print("URI: " + str(retrieve_result["DocumentURI"]))
print("Passage content: " + str(retrieve_result["Content"]))
print("------------------\n\n")