에서 SageMaker 훈련 작업 대기열 생성 AWS Batch - AWS Batch

기계 번역으로 제공되는 번역입니다. 제공된 번역과 원본 영어의 내용이 상충하는 경우에는 영어 버전이 우선합니다.

에서 SageMaker 훈련 작업 대기열 생성 AWS Batch

SageMaker 훈련 작업 대기열은 SageMaker AI 서비스와 직접 통합되어 기본 컴퓨팅 인프라를 관리할 필요 없이 서버리스 작업 일정을 제공합니다.

사전 조건

SageMaker 훈련 작업 대기열을 생성하기 전에 다음을 갖추어야 합니다.

Create a SageMaker Training job queue (AWS Batch console)
  1. https://console.aws.amazon.com/batch/ AWS Batch 콘솔을 엽니다.

  2. 탐색 창에서 작업 대기열생성을 선택합니다.

  3. 오케스트레이션 유형에서 SageMaker 훈련을 선택합니다.

  4. 작업 대기열 구성의 경우:

    1. 이름에 작업 대기열의 이름을 입력합니다.

    2. Priority에 0에서 1000 사이의 값을 입력합니다. 우선 순위가 높은 작업 대기열에는 서비스 환경에 대한 기본 설정이 지정됩니다.

    3. (선택 사항)예약 정책 Amazon 리소스 이름(ARN)에서 기존 예약 정책을 선택합니다.

    4. 연결된 서비스 환경의 경우 목록에서 작업 대기열과 연결할 서비스 환경을 선택합니다.

  5. (선택 사항) 작업 상태 제한의 경우:

    1. 잘못된 구성에서를 SERVICE_ENVIRONMENT_MAX_RESOURCE 선택하고 최대 실행 가능 시간(초)을 입력합니다.

    2. 용량에서를 INSUFFICIENT_INSTANCE_CAPACITY 선택하고 최대 실행 가능 시간(초)을 입력합니다.

  6. 작업 대기열 생성을 선택합니다.

Create a SageMaker Training job queue (AWS CLI)

create-job-queue 명령을 사용하여 SageMaker 훈련 작업 대기열을 생성합니다.

다음 예시에서는 서비스 환경을 사용하는 기본 SageMaker 훈련 작업 대기열을 생성합니다.

aws batch create-job-queue \ --job-queue-name my-sm-training-fifo-jq \ --job-queue-type SAGEMAKER_TRAINING \ --priority 1 \ --service-environment-order order=1,serviceEnvironment=ExampleServiceEnvironment

ExampleServiceEnvironment를 서비스 환경의 이름으로 바꿉니다.

이 명령은 다음과 비슷한 출력을 반환합니다.

{ "jobQueueName": "my-sm-training-fifo-jq", "jobQueueArn": "arn:aws:batch:region:account:job-queue/my-sm-training-fifo-jq" }

작업 대기열을 생성한 후 성공적으로 생성되었고 유효한 상태인지 확인합니다.

describe-job-queues 명령을 사용하여 작업 대기열에 대한 세부 정보를 봅니다.

aws batch describe-job-queues --job-queues my-sm-training-fifo-jq

이 명령은 다음과 비슷한 출력을 반환합니다.

{ "jobQueues": [ { "jobQueueName": "my-sm-training-fifo-jq", "jobQueueArn": "arn:aws:batch:region:account:job-queue/my-sm-training-fifo-jq", "state": "ENABLED", "status": "VALID", "statusReason": "JobQueue Healthy", "priority": 1, "computeEnvironmentOrder": [], "serviceEnvironmentOrder": [ { "order": 1, "serviceEnvironment": "arn:aws:batch:region:account:service-environment/ExampleServiceEnvironment" } ], "jobQueueType": "SAGEMAKER_TRAINING", "tags": {}, "jobStateTimeLimitActions": [] } ] }

다음을 확인하세요.

  • state입니다. ENABLED

  • status입니다. VALID

  • statusReason입니다. JobQueue Healthy

  • jobQueueType입니다. SAGEMAKER_TRAINING

  • 는 서비스 환경을 serviceEnvironmentOrder 참조합니다.