Dataset sintetis - Amazon SageMaker AI

Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.

Dataset sintetis

SageMaker Clarify menggunakan algoritma Kernel SHAP. Diberikan catatan (juga disebut sampel atau instance) dan konfigurasi SHAP, penjelasan pertama-tama menghasilkan kumpulan data sintetis. SageMaker Klarifikasi kemudian kueri wadah model untuk prediksi kumpulan data, lalu hitung dan kembalikan atribusi fitur. Ukuran kumpulan data sintetis memengaruhi runtime untuk penjelasan Clarify. Kumpulan data sintetis yang lebih besar membutuhkan lebih banyak waktu untuk mendapatkan prediksi model daripada yang lebih kecil.

Ukuran dataset sintetis ditentukan oleh rumus berikut:

Synthetic dataset size = SHAP baseline size * n_samples

Ukuran dasar SHAP adalah jumlah catatan dalam data dasar SHAP. Informasi ini diambil dariShapBaselineConfig.

Ukuran n_samples diatur oleh parameter NumberOfSamples dalam konfigurasi explainer dan jumlah fitur. Jika jumlah fitur adalahn_features, maka n_samples adalah sebagai berikut:

n_samples = MIN(NumberOfSamples, 2^n_features - 2)

Berikut ini menunjukkan n_samples jika NumberOfSamples tidak disediakan.

n_samples = MIN(2*n_features + 2^11, 2^n_features - 2)

Misalnya, catatan tabular dengan 10 fitur memiliki ukuran dasar SHAP 1. Jika tidak NumberOfSamples disediakan, dataset sintetis berisi 1022 catatan. Jika catatan memiliki 20 fitur, dataset sintetis berisi 2088 catatan.

Untuk masalah NLP, n_features sama dengan jumlah fitur non-teks ditambah jumlah unit teks.

catatan

InvokeEndpointAPI memiliki batas waktu tunggu permintaan. Jika kumpulan data sintetis terlalu besar, penjelasan mungkin tidak dapat menyelesaikan perhitungan dalam batas ini. Jika perlu, gunakan informasi sebelumnya untuk memahami dan mengurangi ukuran dasar SHAP dan. NumberOfSamples Jika wadah model Anda diatur untuk menangani permintaan batch, maka Anda juga dapat menyesuaikan nilaiMaxRecordCount.