Pengambilan Generasi Augmented - Amazon SageMaker

Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.

Pengambilan Generasi Augmented

Model foundation biasanya dilatih secara offline, membuat model agnostik terhadap data apa pun yang dibuat setelah model dilatih. Selain itu, model foundation dilatih pada corpora domain yang sangat umum, membuatnya kurang efektif untuk tugas-tugas khusus domain. Anda dapat menggunakan Retrieval Augmented Generation (RAG) untuk mengambil data dari luar model foundation dan menambah prompt Anda dengan menambahkan data yang diambil yang relevan dalam konteks. Untuk informasi selengkapnya tentang arsitektur RAG model, lihat Retrieval-Augmented Generation for Knowledge-Intensive Tasks. NLP

DenganRAG, data eksternal yang digunakan untuk menambah prompt Anda dapat berasal dari beberapa sumber data, seperti repositori dokumen, database, atau. APIs Langkah pertama adalah mengonversi dokumen Anda dan kueri pengguna apa pun menjadi format yang kompatibel untuk melakukan pencarian relevansi. Untuk membuat format yang kompatibel, koleksi dokumen, atau pustaka pengetahuan, dan kueri yang dikirimkan pengguna dikonversi ke representasi numerik menggunakan model bahasa penyematan. Embedding adalah proses dimana teks diberikan representasi numerik dalam ruang vektor. RAGarsitektur model membandingkan penyematan kueri pengguna dalam vektor perpustakaan pengetahuan. Prompt pengguna asli kemudian ditambahkan dengan konteks yang relevan dari dokumen serupa dalam perpustakaan pengetahuan. Prompt tambahan ini kemudian dikirim ke model pondasi. Anda dapat memperbarui pustaka pengetahuan dan penyematannya yang relevan secara asinkron.

A model architecture diagram of Retrieval Augmented Generation (RAG).

Dokumen yang diambil harus cukup besar untuk berisi konteks yang berguna untuk membantu menambah prompt, tetapi cukup kecil untuk masuk ke dalam panjang urutan maksimum prompt. Anda dapat menggunakan JumpStart model khusus tugas, seperti model General Text Embeddings () dari GTE Hugging Face, untuk menyediakan embeddings untuk petunjuk dan dokumen perpustakaan pengetahuan Anda. Setelah membandingkan prompt dan penyematan dokumen untuk menemukan dokumen yang paling relevan, buat prompt baru dengan konteks tambahan. Kemudian, teruskan augmented prompt ke model pembuatan teks yang Anda pilih.

Notebook contoh

Untuk informasi lebih lanjut tentang solusi model RAG foundation, lihat contoh notebook berikut:

Anda dapat mengkloning repositori SageMaker contoh Amazon untuk menjalankan contoh model JumpStart dasar yang tersedia di lingkungan Jupyter pilihan Anda dalam Studio. Untuk informasi selengkapnya tentang aplikasi yang dapat Anda gunakan untuk membuat dan mengakses Jupyter SageMaker, lihat. Aplikasi yang didukung di Amazon SageMaker Studio