Peringatan Evaluasi

Amazon ML memberikan wawasan untuk membantu Anda memvalidasi apakah Anda mengevaluasi model dengan benar. Jika salah satu kriteria validasi tidak dipenuhi oleh evaluasi, konsol Amazon Amazon memberi tahu Anda dengan menampilkan kriteria validasi yang telah dilanggar, sebagai berikut.

Evaluasi model ML dilakukan pada data yang ditahan

Amazon ML memberi tahu Anda jika Anda menggunakan sumber data yang sama untuk pelatihan dan evaluasi. Jika Anda menggunakan Amazon ML untuk membagi data Anda, Anda akan memenuhi kriteria validitas ini. Jika Anda tidak menggunakan Amazon ML untuk membagi data Anda, pastikan untuk mengevaluasi model ML Anda dengan sumber data selain sumber data pelatihan.
Data yang cukup digunakan untuk evaluasi model prediktif

Amazon ML memberi tahu Anda jika jumlah pengamatan/catatan dalam data evaluasi Anda kurang dari 10% jumlah pengamatan yang Anda miliki dalam sumber data pelatihan Anda. Untuk mengevaluasi model Anda dengan benar, penting untuk menyediakan sampel data yang cukup besar. Kriteria ini memberikan pemeriksaan untuk memberi tahu Anda jika Anda menggunakan terlalu sedikit data. Jumlah data yang diperlukan untuk mengevaluasi model ML Anda bersifat subjektif. 10% dipilih di sini sebagai stop gap tanpa adanya ukuran yang lebih baik.
Skema cocok

Amazon ML memberi tahu Anda jika skema untuk sumber data pelatihan dan evaluasi tidak sama. Jika Anda memiliki atribut tertentu yang tidak ada dalam sumber data evaluasi atau jika Anda memiliki atribut tambahan, Amazon ML akan menampilkan peringatan ini.
Semua catatan dari file evaluasi digunakan untuk evaluasi kinerja model prediktif

Penting untuk mengetahui apakah semua catatan yang disediakan untuk evaluasi benar-benar digunakan untuk mengevaluasi model. Amazon ML memberi tahu Anda jika beberapa catatan dalam sumber data evaluasi tidak valid dan tidak disertakan dalam perhitungan metrik akurasi. Misalnya, jika variabel target hilang untuk beberapa pengamatan dalam sumber data evaluasi, Amazon ML tidak dapat memeriksa apakah prediksi model ML untuk pengamatan ini benar. Dalam hal ini, catatan dengan nilai target yang hilang dianggap tidak valid.
Distribusi variabel target

Amazon ML menunjukkan distribusi atribut target dari sumber data pelatihan dan evaluasi sehingga Anda dapat meninjau apakah target didistribusikan dengan cara yang sama di kedua sumber data. Jika model dilatih pada data pelatihan dengan distribusi target yang berbeda dari distribusi target pada data evaluasi, maka kualitas evaluasi dapat menurun karena sedang dihitung pada data dengan statistik yang sangat berbeda. Yang terbaik adalah memiliki data yang didistribusikan dengan cara yang sama di atas data pelatihan dan evaluasi, dan mintalah kumpulan data ini meniru sebanyak mungkin data yang akan ditemui model saat membuat prediksi.

Jika peringatan ini terpicu, coba gunakan strategi pemisahan acak untuk membagi data menjadi sumber data pelatihan dan evaluasi. Dalam kasus yang jarang terjadi, peringatan ini mungkin secara keliru memperingatkan Anda tentang perbedaan distribusi target meskipun Anda membagi data secara acak. Amazon ML menggunakan perkiraan statistik data untuk mengevaluasi distribusi data, kadang-kadang memicu peringatan ini karena kesalahan.

Awas Javascript dinonaktifkan atau tidak tersedia di browser Anda.

Untuk menggunakan Dokumentasi AWS, Javascript harus diaktifkan. Lihat halaman Bantuan browser Anda untuk petunjuk.

Konvensi Dokumen

Validasi Lintas

Menghasilkan dan Menafsirkan Prediksi