Petunjuk evaluator metrik bawaan untuk model-as-a-judge pekerjaan evaluasi - Amazon Bedrock

Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.

Petunjuk evaluator metrik bawaan untuk model-as-a-judge pekerjaan evaluasi

Saat Anda menjalankan pekerjaan evaluasi model berbasis juri, model evaluator menilai respons model generator sesuai dengan sekumpulan metrik yang Anda tentukan. Amazon Bedrock menawarkan sejumlah metrik bawaan, atau Anda dapat menentukan metrik kustom Anda sendiri.

Lihat bagian berikut untuk melihat petunjuk yang digunakan oleh model evaluator yang tersedia untuk metrik bawaan Amazon Bedrock.