Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.
Aktifkan pelatihan
Saat menambahkan model untuk dibagikan, Anda dapat menyediakan lingkungan pelatihan secara opsional dan memungkinkan kolaborator di organisasi Anda untuk melatih model bersama.
catatan
Jika Anda menambahkan model tabel, Anda juga perlu menentukan format kolom dan kolom target untuk mengaktifkan pelatihan.
Setelah memberikan detail dasar tentang model Anda, Anda harus mengonfigurasi pengaturan untuk pekerjaan pelatihan yang akan digunakan untuk melatih model Anda. Ini melibatkan menentukan lingkungan kontainer, skrip kode, kumpulan data, lokasi keluaran, dan berbagai parameter lainnya untuk mengontrol bagaimana pekerjaan pelatihan dijalankan. Untuk mengonfigurasi pengaturan pekerjaan pelatihan, ikuti langkah-langkah ini:
-
Tambahkan wadah untuk digunakan untuk pelatihan model. Anda dapat memilih wadah yang digunakan untuk pekerjaan pelatihan yang ada, membawa wadah Anda sendiri di Amazon ECR, atau menggunakan Amazon SageMaker AI Deep Learning Container.
-
Tambahkan variabel lingkungan.
-
Berikan lokasi skrip pelatihan.
-
Berikan titik masuk mode skrip.
-
Berikan URI Amazon S3 untuk artefak model yang dihasilkan selama pelatihan.
-
Berikan URI Amazon S3 ke kumpulan data pelatihan default.
-
Berikan jalur keluaran model. Jalur keluaran model harus berupa jalur URI Amazon S3 untuk artefak model apa pun yang dihasilkan dari pelatihan. SageMaker AI menyimpan artefak model sebagai file TAR terkompresi tunggal di Amazon S3.
-
Berikan kumpulan data validasi yang akan digunakan untuk mengevaluasi model Anda selama pelatihan. Kumpulan data validasi harus berisi jumlah kolom yang sama dan header fitur yang sama dengan kumpulan data pelatihan.
-
Nyalakan isolasi jaringan. Isolasi jaringan mengisolasi wadah model sehingga tidak ada panggilan jaringan masuk atau keluar yang dapat dilakukan ke atau dari wadah model.
-
Sediakan saluran pelatihan di mana SageMaker AI dapat mengakses data Anda. Misalnya, Anda dapat menentukan saluran input bernama
train
atautest
. Untuk setiap saluran, tentukan nama saluran dan URI ke lokasi data Anda. Pilih Jelajahi untuk mencari lokasi Amazon S3. -
Berikan hiperparameter. Tambahkan hiperparameter apa pun yang harus dicoba oleh kolaborator selama pelatihan. Berikan berbagai nilai yang valid untuk hiperparameter ini. Rentang ini digunakan untuk melatih validasi hyperparameter pekerjaan. Anda dapat menentukan rentang berdasarkan tipe data dari hyperparameter.
-
Pilih jenis instance. Kami merekomendasikan instans GPU dengan lebih banyak memori untuk pelatihan dengan ukuran batch besar. Untuk daftar lengkap instans SageMaker pelatihan di seluruh AWS Wilayah, lihat tabel Harga Sesuai Permintaan di Amazon SageMaker AI
Pricing. -
Berikan metrik. Tentukan metrik untuk pekerjaan pelatihan dengan menentukan nama dan ekspresi reguler untuk setiap metrik yang dipantau pelatihan Anda. Rancang ekspresi reguler untuk menangkap nilai metrik yang dipancarkan algoritme Anda. Misalnya, metrik
loss
mungkin memiliki ekspresi reguler"Loss =(.*?);"
.