Buat Sumber Daya Algoritma - Amazon SageMaker

Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.

Buat Sumber Daya Algoritma

Untuk membuat sumber daya algoritme yang dapat Anda gunakan untuk menjalankan pekerjaan pelatihan di Amazon SageMaker dan mempublikasikan pada AWS Marketplace tentukan informasi berikut:

  • Kontainer Docker yang berisi pelatihan dan, secara opsional, kode inferensi.

  • Konfigurasi data input yang diharapkan algoritme Anda untuk pelatihan.

  • Hyperparameter yang didukung algoritma Anda.

  • Metrik yang dikirimkan algoritme Anda ke Amazon CloudWatch selama pekerjaan pelatihan.

  • Jenis instans yang didukung algoritme Anda untuk pelatihan dan inferensi, dan apakah itu mendukung pelatihan terdistribusi di beberapa instance.

  • Profil validasi, yang merupakan pekerjaan pelatihan yang SageMaker digunakan untuk menguji kode pelatihan algoritme Anda dan pekerjaan transformasi batch yang SageMaker berjalan untuk menguji kode inferensi algoritme Anda.

    Untuk memastikan bahwa pembeli dan penjual dapat yakin bahwa produk berfungsi SageMaker, kami mengharuskan Anda memvalidasi algoritme Anda sebelum mencantumkannya. AWS Marketplace Anda dapat membuat daftar produk AWS Marketplace hanya jika validasi berhasil. Untuk memvalidasi algoritme, SageMaker gunakan profil validasi dan data sampel untuk menjalankan tugas validasi berikut:

    1. Buat pekerjaan pelatihan di akun Anda untuk memverifikasi bahwa gambar pelatihan Anda berfungsi SageMaker.

    2. Jika Anda menyertakan kode inferensi dalam algoritme Anda, buat model di akun Anda menggunakan gambar inferensi algoritme dan artefak model yang dihasilkan oleh pekerjaan pelatihan.

    3. Jika Anda menyertakan kode inferensi dalam algoritme Anda, buat pekerjaan transformasi di akun Anda menggunakan model untuk memverifikasi bahwa gambar inferensi Anda berfungsi. SageMaker

    Ketika Anda mencantumkan produk Anda AWS Marketplace, input dan output dari proses validasi ini tetap ada sebagai bagian dari produk Anda dan tersedia untuk pembeli Anda. Ini membantu pembeli memahami dan mengevaluasi produk sebelum mereka membelinya. Misalnya, pembeli dapat memeriksa data input yang Anda gunakan, output yang dihasilkan, dan log serta metrik yang dipancarkan oleh kode Anda. Semakin komprehensif spesifikasi validasi Anda, semakin mudah bagi pelanggan untuk mengevaluasi produk Anda.

    catatan

    Di profil validasi Anda, berikan hanya data yang ingin Anda paparkan secara publik.

    Validasi dapat memakan waktu hingga beberapa jam. Untuk melihat status pekerjaan di akun Anda, di SageMaker konsol, lihat halaman Training jobs dan Transform jobs. Jika validasi gagal, Anda dapat mengakses laporan pemindaian dan validasi dari konsol. SageMaker Jika ada masalah yang ditemukan, Anda harus membuat algoritma lagi.

    catatan

    Untuk mempublikasikan algoritme Anda AWS Marketplace, setidaknya diperlukan satu profil validasi.

Anda dapat membuat algoritme dengan menggunakan SageMaker konsol atau SageMaker API.

Membuat Sumber Daya Algoritma (Konsol)

Untuk membuat sumber daya algoritme (konsol)
  1. Buka SageMaker konsol di https://console.aws.amazon.com/sagemaker/.

  2. Dari menu sebelah kiri, pilih Pelatihan.

  3. Dari menu dropdown, pilih Algoritma, lalu pilih Buat algoritma.

  4. Pada halaman Spesifikasi Pelatihan, berikan informasi berikut:

    1. Untuk nama Algoritma, ketikkan nama untuk algoritma Anda. Nama algoritma harus unik di akun Anda dan di AWS wilayah tersebut. Nama harus memiliki 1 hingga 64 karakter. Karakter yang valid adalah a-z, A-Z, 0-9, dan - (tanda hubung).

    2. Ketik deskripsi untuk algoritme Anda. Deskripsi ini muncul di SageMaker konsol dan di AWS Marketplace.

    3. Untuk gambar Pelatihan, ketik jalur di Amazon ECR tempat wadah pelatihan Anda disimpan.

    4. Untuk pelatihan terdistribusi Support, Pilih Ya jika algoritme Anda mendukung pelatihan pada beberapa instance. Jika tidak, pilih Tidak.

    5. Untuk jenis instans Support untuk pelatihan, pilih jenis instans yang didukung algoritme Anda.

    6. Untuk spesifikasi Saluran, tentukan hingga 8 saluran data input untuk algoritme Anda. Misalnya, Anda dapat menentukan 3 saluran input bernamatrain,validation, dantest. Untuk setiap saluran, tentukan informasi berikut:

      1. Untuk nama Saluran, ketikkan nama untuk saluran. Nama harus memiliki 1 hingga 64 karakter. Karakter yang valid adalah a-z, A-Z, 0-9, dan - (tanda hubung).

      2. Untuk mewajibkan saluran untuk algoritme Anda, pilih Saluran yang diperlukan.

      3. Ketik deskripsi untuk saluran.

      4. Untuk mode input yang didukung, pilih mode Pipa jika algoritme Anda mendukung streaming data input, dan mode File jika algoritme Anda mendukung pengunduhan data input sebagai file. Anda dapat memilih keduanya.

      5. Untuk jenis konten yang didukung, ketik tipe MIME yang diharapkan algoritme untuk data masukan.

      6. Untuk jenis kompresi yang didukung, pilih Gzip jika algoritme Anda mendukung kompresi Gzip. Jika tidak, pilih Tidak ada.

      7. Pilih Tambah saluran untuk menambahkan saluran input data lain, atau pilih Berikutnya jika Anda selesai menambahkan saluran.

  5. Pada halaman spesifikasi Tuning, berikan informasi berikut:

    1. Untuk spesifikasi Hyperparameter, tentukan hyperparameters yang didukung algoritme Anda dengan mengedit objek JSON. Untuk setiap hyperparameter yang didukung algoritme Anda, buat blok JSON yang mirip dengan berikut ini:

      { "DefaultValue": "5", "Description": "The first hyperparameter", "IsRequired": true, "IsTunable": false, "Name": "intRange", "Range": { "IntegerParameterRangeSpecification": { "MaxValue": "10", "MinValue": "1" }, "Type": "Integer" }

      Di JSON, berikan yang berikut ini:

      1. UntukDefaultValue, tentukan nilai default untuk hyperparameter, jika ada.

      2. UntukDescription, tentukan deskripsi untuk hyperparameter.

      3. UntukIsRequired, tentukan apakah hyperparameter diperlukan.

      4. UntukIsTunable, tentukan true apakah hyperparameter ini dapat disetel saat pengguna menjalankan tugas tuning hyperparameter yang menggunakan algoritme ini. Untuk informasi, lihat Lakukan penyetelan model otomatis dengan SageMaker.

      5. UntukName, tentukan nama untuk hyperparameter.

      6. UntukRange, tentukan salah satu dari berikut ini:

        • IntegerParameterRangeSpecification- nilai hyperparameter adalah bilangan bulat. Tentukan nilai minimum dan maksimum untuk hyperparameter.

        • ContinuousParameterRangeSpecification- nilai hyperparameter adalah nilai floating-point. Tentukan nilai minimum dan maksimum untuk hyperparameter.

        • CategoricalParameterRangeSpecification- nilai hyperparameter adalah nilai kategoris. Tentukan daftar semua nilai yang mungkin.

      7. UntukType, tentukanInteger,Continuous, atauCategorical. Nilai harus sesuai dengan jenis Range yang Anda tentukan.

    2. Untuk definisi Metrik, tentukan metrik pelatihan apa pun yang Anda ingin algoritme Anda pancarkan. SageMaker menggunakan ekspresi reguler yang Anda tentukan untuk menemukan metrik dengan mengurai log dari wadah pelatihan selama pelatihan. Pengguna dapat melihat metrik ini saat mereka menjalankan pekerjaan pelatihan dengan algoritme Anda, dan mereka dapat memantau dan memplot metrik di Amazon. CloudWatch Untuk informasi, lihat Pantau dan Analisis Pekerjaan Pelatihan Menggunakan CloudWatch Metrik Amazon. Untuk setiap metrik, berikan informasi berikut:

      1. Untuk nama Metrik, ketikkan nama untuk metrik.

      2. UntukRegex, ketik ekspresi reguler yang SageMaker digunakan untuk mengurai log pelatihan sehingga dapat menemukan nilai metrik.

      3. Untuk dukungan metrik Objective pilih Yes jika metrik ini dapat digunakan sebagai metrik objektif untuk pekerjaan tuning hyperparameter. Untuk informasi, lihat Lakukan penyetelan model otomatis dengan SageMaker.

      4. Pilih Tambahkan metrik untuk menambahkan metrik lain, atau pilih Berikutnya jika Anda selesai menambahkan metrik.

  6. Pada halaman spesifikasi Inferensi, berikan informasi berikut jika algoritme Anda mendukung inferensi:

    1. Untuk Lokasi gambar inferensi, ketik jalur di Amazon ECR tempat wadah inferensi Anda disimpan.

    2. Untuk nama host DNS Container, ketikkan nama host DNS untuk gambar Anda.

    3. Untuk tipe instans yang Didukung untuk inferensi waktu nyata, pilih jenis instans yang didukung algoritme Anda untuk model yang digunakan sebagai titik akhir yang dihosting. SageMaker Untuk informasi, lihat Menyebarkan model untuk inferensi.

    4. Untuk tipe instans yang didukung untuk pekerjaan transformasi batch, pilih jenis instans yang didukung algoritme Anda untuk pekerjaan transformasi batch. Untuk informasi, lihat Gunakan transformasi batch untuk menjalankan inferensi dengan Amazon SageMaker.

    5. Untuk jenis konten yang didukung, ketikkan jenis data input yang diharapkan algoritme Anda untuk permintaan inferensi.

    6. Untuk tipe MIME respons yang didukung, ketik tipe MIME yang didukung algoritme Anda untuk respons inferensi.

    7. Pilih Berikutnya.

  7. Pada halaman spesifikasi Validasi, berikan informasi berikut:

    1. Untuk Publikasikan algoritma ini AWS Marketplace, pilih Ya untuk mempublikasikan algoritme AWS Marketplace.

    2. Untuk Validasi sumber daya ini, pilih Ya jika Anda SageMaker ingin menjalankan pekerjaan pelatihan dan/atau pekerjaan transformasi batch yang Anda tentukan untuk menguji pelatihan dan/atau kode inferensi algoritme Anda.

      catatan

      Untuk mempublikasikan algoritme Anda AWS Marketplace, algoritme Anda harus divalidasi.

    3. Untuk peran IAM, pilih peran IAM yang memiliki izin yang diperlukan untuk menjalankan pekerjaan pelatihan dan mengubah pekerjaan secara batch SageMaker, atau pilih Buat peran baru SageMaker untuk memungkinkan membuat peran yang memiliki kebijakan AmazonSageMakerFullAccess terkelola yang dilampirkan. Untuk informasi, lihat Cara menggunakan peran SageMaker eksekusi.

    4. Untuk profil Validasi, tentukan yang berikut ini:

      • Nama untuk profil validasi.

      • Definisi pekerjaan Pelatihan. Ini adalah blok JSON yang menggambarkan pekerjaan pelatihan. Ini dalam format yang sama dengan parameter TrainingJobDefinitioninput CreateAlgorithmAPI.

      • Definisi pekerjaan Transform. Ini adalah blok JSON yang menjelaskan pekerjaan transformasi batch. Ini dalam format yang sama dengan parameter TransformJobDefinitioninput CreateAlgorithmAPI.

    5. Pilih Buat algoritma.

Membuat Sumber Daya Algoritma (API)

Untuk membuat sumber daya algoritme menggunakan SageMaker API, panggil CreateAlgorithmAPI.