Buat antrian pekerjaan SageMaker Pelatihan di AWS Batch - AWS Batch

Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.

Buat antrian pekerjaan SageMaker Pelatihan di AWS Batch

SageMaker Antrian pekerjaan pelatihan terintegrasi langsung dengan layanan SageMaker AI untuk menyediakan penjadwalan pekerjaan tanpa server tanpa mengharuskan Anda mengelola infrastruktur komputasi yang mendasarinya.

Prasyarat

Sebelum membuat antrian pekerjaan SageMaker Pelatihan, pastikan Anda memiliki:

Create a SageMaker Training job queue (AWS Batch console)
  1. Buka AWS Batch konsol di https://console.aws.amazon.com/batch/.

  2. Di panel navigasi, pilih Antrian pekerjaan dan Buat.

  3. Untuk jenis Orkestrasi, pilih Pelatihan. SageMaker

  4. Untuk konfigurasi antrian Job:

    1. Untuk Nama, masukkan nama antrian Job.

    2. untuk Prioritas, masukkan nilai antara 0 dan 1000. Antrian Job dengan prioritas lebih tinggi diberikan preferensi untuk lingkungan layanan.

    3. (Opsional) Untuk kebijakan Penjadwalan Nama Sumber Daya Amazon (ARN), pilih kebijakan penjadwalan yang ada.

    4. Untuk lingkungan layanan Terhubung, pilih lingkungan layanan dari daftar untuk dikaitkan dengan antrian pekerjaan.

  5. (Opsional) Untuk batas status Job:

    1. Untuk Misconfiguration, pilih SERVICE_ENVIRONMENT_MAX_RESOURCE dan masukkan Maksimum runnable time (detik).

    2. Untuk Kapasitas, pilih INSUFFICIENT_INSTANCE_CAPACITY dan masukkan Waktu runnable maksimum (detik).

  6. Pilih Buat antrian pekerjaan

Create a SageMaker Training job queue (AWS CLI)

Gunakan create-job-queue perintah untuk membuat antrean pekerjaan SageMaker Pelatihan.

Contoh berikut membuat antrian pekerjaan SageMaker Pelatihan dasar yang menggunakan lingkungan layanan:

aws batch create-job-queue \ --job-queue-name my-sm-training-fifo-jq \ --job-queue-type SAGEMAKER_TRAINING \ --priority 1 \ --service-environment-order order=1,serviceEnvironment=ExampleServiceEnvironment

Ganti ExampleServiceEnvironment dengan nama lingkungan layanan Anda.

Perintah tersebut mengembalikan output serupa dengan berikut ini:

{ "jobQueueName": "my-sm-training-fifo-jq", "jobQueueArn": "arn:aws:batch:region:account:job-queue/my-sm-training-fifo-jq" }

Setelah membuat antrian pekerjaan Anda, verifikasi bahwa itu berhasil dibuat dan dalam keadaan valid.

Gunakan describe-job-queues perintah untuk melihat detail tentang antrian pekerjaan Anda:

aws batch describe-job-queues --job-queues my-sm-training-fifo-jq

Perintah tersebut mengembalikan output serupa dengan berikut ini:

{ "jobQueues": [ { "jobQueueName": "my-sm-training-fifo-jq", "jobQueueArn": "arn:aws:batch:region:account:job-queue/my-sm-training-fifo-jq", "state": "ENABLED", "status": "VALID", "statusReason": "JobQueue Healthy", "priority": 1, "computeEnvironmentOrder": [], "serviceEnvironmentOrder": [ { "order": 1, "serviceEnvironment": "arn:aws:batch:region:account:service-environment/ExampleServiceEnvironment" } ], "jobQueueType": "SAGEMAKER_TRAINING", "tags": {}, "jobStateTimeLimitActions": [] } ] }

Pastikan bahwa:

  • stateadalah ENABLED

  • statusadalah VALID

  • statusReasonadalah JobQueue Healthy

  • jobQueueTypeadalah SAGEMAKER_TRAINING

  • serviceEnvironmentOrderReferensi lingkungan layanan Anda