Opsi AI generatif untuk menanyakan dokumen khusus - AWS Bimbingan Preskriptif

Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.

Opsi AI generatif untuk menanyakan dokumen khusus

Organizations sering memiliki berbagai sumber data terstruktur dan tidak terstruktur. Panduan ini berfokus pada bagaimana Anda dapat menggunakan AI generatif untuk menjawab pertanyaan dari data yang tidak terstruktur.

Data yang tidak terstruktur dalam organisasi Anda dapat berasal dari berbagai sumber. Ini mungkin PDFs, file teks, wiki internal, dokumen teknis, situs web publik, basis pengetahuan, atau lainnya. Jika Anda menginginkan model dasar yang dapat menjawab pertanyaan tentang data tidak terstruktur, opsi berikut tersedia:

  • Latih model yayasan baru dengan menggunakan dokumen khusus Anda dan data pelatihan lainnya

  • Sempurnakan model foundation yang ada dengan menggunakan data dari dokumen kustom Anda

  • Gunakan pembelajaran dalam konteks untuk meneruskan dokumen ke model yayasan saat Anda mengajukan pertanyaan

  • Gunakan pendekatan Retrieval Augmented Generation (RAG)

Melatih model fondasi baru dari awal yang menyertakan data kustom Anda adalah usaha yang ambisius. Beberapa perusahaan telah berhasil melakukannya, seperti Bloomberg dengan mereka BloombergGPTmodel. Contoh lainnya adalah multimodal EXAONEmodel oleh LG AI Research, yang dilatih dengan menggunakan 600 miliar karya seni dan 250 juta gambar resolusi tinggi, disertai dengan teks. Menurut Biaya AI: Haruskah Anda Membangun atau Membeli Model Foundation Anda (LinkedIn), model yang mirip dengan Meta Llama 2 biaya sekitar USD $4,8 juta untuk melatih. Ada dua prasyarat utama untuk melatih model dari awal: akses ke sumber daya (keuangan, teknis, waktu) dan pengembalian investasi yang jelas. Jika ini tampaknya tidak cocok, maka opsi selanjutnya adalah menyempurnakan model pondasi yang ada.

Menyesuaikan model yang ada melibatkan pengambilan model, seperti Amazon Titan, Mistral, atau model Llama, dan kemudian mengadaptasi model ke data kustom Anda. Ada berbagai teknik untuk fine-tuning, yang sebagian besar melibatkan memodifikasi hanya beberapa parameter alih-alih memodifikasi semua parameter dalam model. Ini disebut fine-tuning parameter-efisien. Ada dua metode utama untuk fine-tuning:

  • Penyetelan halus yang diawasi menggunakan data berlabel dan membantu Anda melatih model untuk jenis tugas baru. Misalnya, jika Anda ingin membuat laporan berdasarkan formulir PDF, maka Anda mungkin harus mengajarkan model bagaimana melakukannya dengan memberikan contoh yang cukup.

  • Penyetelan halus tanpa pengawasan adalah agnostik tugas dan menyesuaikan model fondasi dengan data Anda sendiri. Ini melatih model untuk memahami konteks dokumen Anda. Model fine-tuned kemudian membuat konten, seperti laporan, dengan menggunakan gaya yang lebih kustom organisasi Anda.

Namun, fine-tuning mungkin tidak ideal untuk kasus penggunaan tanya jawab. Untuk informasi selengkapnya, lihat Membandingkan RAG dan fine-tuning dalam panduan ini.

Ketika Anda mengajukan pertanyaan, Anda dapat meneruskan dokumen model dasar dan menggunakan pembelajaran dalam konteks model untuk mengembalikan jawaban dari dokumen. Opsi ini cocok untuk kueri ad-hoc dari satu dokumen. Namun, solusi ini tidak berfungsi dengan baik untuk menanyakan beberapa dokumen atau untuk sistem kueri dan aplikasi, seperti Microsoft SharePoint atau Atlassian Confluence.

Opsi terakhir adalah menggunakan RAG. Dengan RAG, model foundation mereferensikan dokumen kustom Anda sebelum menghasilkan respons. RAG memperluas kemampuan model ke basis pengetahuan internal organisasi Anda, semua tanpa perlu melatih kembali model. Ini adalah pendekatan hemat biaya untuk meningkatkan output model sehingga tetap relevan, akurat, dan berguna dalam berbagai konteks.