Mempersiapkan dan mengunggah data pelatihan untuk penyesuaian penyesuaian domain Buat pekerjaan pelatihan untuk fine-tuning berbasis instruksi Notebook contoh

Sempurnakan model bahasa besar (LLM) menggunakan adaptasi domain

Penyetelan penyesuaian domain memungkinkan Anda memanfaatkan model fondasi yang telah dilatih sebelumnya dan menyesuaikannya dengan tugas tertentu menggunakan data spesifik domain terbatas. Jika upaya rekayasa yang cepat tidak memberikan penyesuaian yang cukup, Anda dapat menggunakan penyesuaian penyesuaian domain untuk membuat model Anda bekerja dengan bahasa khusus domain, seperti jargon industri, istilah teknis, atau data khusus lainnya. Proses fine-tuning ini memodifikasi bobot model.

Untuk menyempurnakan model Anda pada kumpulan data khusus domain:

Siapkan data pelatihan Anda. Untuk petunjuk, lihat Mempersiapkan dan mengunggah data pelatihan untuk penyesuaian penyesuaian domain.
Buat pekerjaan pelatihan fine-tuning Anda. Untuk petunjuk, lihat Buat pekerjaan pelatihan untuk fine-tuning berbasis instruksi.

Anda dapat menemukan end-to-end contoh diNotebook contoh.

Penyetelan penyesuaian domain tersedia dengan model fondasi berikut:

catatan

Beberapa model JumpStart dasar, seperti Llama 2 7B, memerlukan penerimaan perjanjian lisensi pengguna akhir sebelum menyempurnakan dan melakukan inferensi. Untuk informasi selengkapnya, lihat Perjanjian lisensi pengguna akhir.

Mekar 3B
Mekar 7B1
BloomZ 3B FP16
BloomZ 7B1 FP16
GPT-2 XL
GPT-J 6B
GPT-Neo 1.3B
GPT-Neo 125M
GPT-NEO 2.7B
Llama 2 13B
Llama 2 13B Obrolan
Llama 2 13B Neuron
Llama 2 70B
Llama 2 70B Obrolan
Llama 2 7B
Llama 2 7B Obrolan
Llama 2 7B Neuron

Mempersiapkan dan mengunggah data pelatihan untuk penyesuaian penyesuaian domain

Data pelatihan untuk fine-tuning adaptasi domain dapat disediakan dalam format file CSV, JSON, atau TXT. Semua data pelatihan harus dalam satu file dalam satu folder.

Data pelatihan diambil dari kolom Teks untuk file data pelatihan CSV atau JSON. Jika tidak ada kolom yang diberi label Teks, maka data pelatihan diambil dari kolom pertama untuk file data pelatihan CSV atau JSON.

Berikut ini adalah contoh isi file TXT yang akan digunakan untuk fine-tuning:


This report includes estimates, projections, statements relating to our
business plans, objectives, and expected operating results that are “forward-
looking statements” within the meaning of the Private Securities Litigation
Reform Act of 1995, Section 27A of the Securities Act of 1933, and Section 21E
of ....

Pisahkan data untuk pelatihan dan pengujian

Anda dapat secara opsional menyediakan folder lain yang berisi data validasi. Folder ini juga harus menyertakan satu file CSV, JSON, atau TXT. Jika tidak ada kumpulan data validasi yang disediakan, maka sejumlah data pelatihan disisihkan untuk tujuan validasi. Anda dapat menyesuaikan persentase data pelatihan yang digunakan untuk validasi ketika Anda memilih hyperparameters untuk menyempurnakan model Anda.

Unggah data fine-tuning ke Amazon S3

Unggah data yang sudah disiapkan ke Amazon Simple Storage Service (Amazon S3) untuk digunakan saat JumpStart menyempurnakan model foundation. Anda dapat menggunakan perintah berikut untuk mengunggah data Anda:


from sagemaker.s3 import S3Uploader
import sagemaker
import random

output_bucket = sagemaker.Session().default_bucket()
local_data_file = "train.txt"
train_data_location = f"s3://{output_bucket}/training_folder"
S3Uploader.upload(local_data_file, train_data_location)
S3Uploader.upload("template.json", train_data_location)
print(f"Training data: {train_data_location}")

Buat pekerjaan pelatihan untuk fine-tuning berbasis instruksi

Setelah data Anda diunggah ke Amazon S3, Anda dapat menyempurnakan dan menerapkan model foundation Anda. JumpStart Untuk menyempurnakan model Anda di Studio, lihat. Sempurnakan model di Studio Untuk menyempurnakan model Anda menggunakan SageMaker Python SDK, lihat. Sempurnakan model foundation yang tersedia untuk umum dengan kelasnya JumpStartEstimator

Notebook contoh

Untuk informasi selengkapnya tentang fine-tuning adaptasi domain, lihat contoh buku catatan berikut:

Awas Javascript dinonaktifkan atau tidak tersedia di browser Anda.

Untuk menggunakan Dokumentasi AWS, Javascript harus diaktifkan. Lihat halaman Bantuan browser Anda untuk petunjuk.

Konvensi Dokumen

Penyetelan halus

Sempurnakan model dengan instruksi yang cepat