에서 컴퓨팅 노드 그룹 생성 AWS PCS - AWS PCS

기계 번역으로 제공되는 번역입니다. 제공된 번역과 원본 영어의 내용이 상충하는 경우에는 영어 버전이 우선합니다.

에서 컴퓨팅 노드 그룹 생성 AWS PCS

이 주제에서는 사용 가능한 옵션에 대한 개요를 제공하고 AWS 병렬 컴퓨팅 서비스()에서 컴퓨팅 노드 그룹을 생성할 때 고려해야 할 사항에 대해 설명합니다AWS PCS. 에서 컴퓨팅 노드 그룹을 처음 생성하는 경우 의 자습서를 따르는 AWS PCS것이 좋습니다시작하기 AWS PCS. 자습서는 가능한 모든 옵션과 HPC 시스템 아키텍처로 확장하지 않고도 작업 시스템을 생성하는 데 도움이 될 수 있습니다.

사전 조건

  • 에서 원하는 수의 EC2 인스턴스를 시작하기에 충분한 서비스 할당량입니다 AWS 리전. AWS Management Console 를 사용하여 서비스 할당량 증가를 확인하고 요청할 수 있습니다.

  • 네트워킹 요구 사항을 충족하는 AWS PCS 기존 VPC 및 서브넷(들)입니다. 프로덕션용으로 클러스터를 배포하기 전에 이러한 요구 사항을 철저히 이해하는 것이 좋습니다. 자세한 내용은 AWS PCSVPC및 서브넷 요구 사항 및 고려 사항 단원을 참조하십시오. CloudFormation 템플릿을 사용하여 VPC 및 서브넷을 생성할 수도 있습니다. 는 CloudFormation 템플릿에 대한 HPC 레시피를 AWS 제공합니다. 자세한 내용은 aws-hpc-recipes의 섹션을 참조하세요 GitHub.

  • RegisterComputeNodeGroupInstance API 작업을 호출하고 노드 그룹 IAM 인스턴스에 AWS PCS 필요한 다른 AWS 리소스에 액세스할 수 있는 권한이 있는 인스턴스 프로파일입니다. 자세한 내용은 IAM AWS 병렬 컴퓨팅 서비스의 인스턴스 프로파일 단원을 참조하십시오.

  • 노드 그룹 인스턴스의 시작 템플릿입니다. 자세한 내용은 Amazon EC2 시작 템플릿을 다음과 같이 사용하기 AWS PCS 단원을 참조하십시오.

  • Amazon EC2 Spot 인스턴스를 사용하는 컴퓨팅 노드 그룹을 생성하려면 에 AWSServiceRoleForEC2Spot 서비스 연결 역할이 있어야 합니다 AWS 계정. 자세한 내용은 에 대한 Amazon EC2 Spot 역할 AWS PCS 단원을 참조하십시오.

에서 컴퓨팅 노드 그룹 생성 AWS PCS

AWS Management Console 또는 를 사용하여 컴퓨팅 노드 그룹을 생성할 수 있습니다 AWS CLI.

AWS Management Console
콘솔을 사용하여 컴퓨팅 노드 그룹을 생성하려면
  1. AWS PCS 콘솔 을 엽니다.

  2. 컴퓨팅 노드 그룹을 생성할 클러스터를 선택합니다. 컴퓨팅 노드 그룹으로 이동하여 생성을 선택합니다.

  3. 노드 그룹 계산 설정 섹션에서 노드 그룹의 이름을 입력합니다. 이름에는 대소문자를 구분하는 영숫자와 하이픈만 사용할 수 있습니다. 영문자로 시작해야 하며 25자를 초과할 수 없습니다. 이름은 클러스터 내에서 고유해야 합니다.

  4. 컴퓨팅 구성 에서 다음 값을 입력하거나 선택합니다.

    1. EC2 시작 템플릿 - 이 노드 그룹에 사용할 사용자 지정 시작 템플릿을 선택합니다. 시작 템플릿을 사용하여 서브넷, 보안 그룹, 모니터링 구성 및 인스턴스 수준 스토리지와 같은 네트워크 설정을 사용자 지정할 수 있습니다. 시작 템플릿이 준비되지 않은 경우 Amazon EC2 시작 템플릿을 다음과 같이 사용하기 AWS PCS를 참조하여 템플릿을 생성하는 방법을 알아봅니다.

      중요

      AWS PCS 는 각 컴퓨팅 노드 그룹에 대한 관리형 시작 템플릿을 생성합니다. 이름은 입니다pcs-identifier-do-not-delete. 컴퓨팅 노드 그룹을 생성하거나 업데이트할 때 이러한 항목을 선택하지 마세요. 그렇지 않으면 노드 그룹이 제대로 작동하지 않습니다.

    2. EC2 시작 템플릿 버전 - 사용자 지정 시작 템플릿의 버전을 선택해야 합니다. 나중에 버전을 변경하는 경우 시작 템플릿의 변경 사항을 감지하도록 컴퓨팅 노드 그룹을 업데이트해야 합니다. 자세한 내용은 AWS PCS컴퓨팅 노드 그룹 업데이트 단원을 참조하십시오.

    3. AMI ID - 시작 템플릿에 AMI ID가 포함되어 있지 않거나 시작 템플릿의 값을 재정의하려면 여기에 AMI ID를 입력합니다. 노드 그룹에 AMI 사용되는 는 와 호환되어야 합니다 AWS PCS. 에서 AMI 제공하는 샘플을 선택할 수도 있습니다 AWS. 이 주제에 대한 자세한 내용은 섹션을 참조하세요아마존 머신 이미지 (AMIs) 용 AWS PCS.

    4. IAM 인스턴스 프로파일 - 노드 그룹의 인스턴스 프로파일을 선택합니다. 인스턴스 프로필은 인스턴스에 리소스 및 서비스에 안전하게 액세스할 AWS 수 있는 권한을 부여합니다. 준비가 되어 있지 않은 경우 IAM AWS 병렬 컴퓨팅 서비스의 인스턴스 프로파일을 참조하여 생성 방법을 알아봅니다.

    5. 서브넷 - 클러스터가 배포VPC되는 에서 하나 이상의 서브넷을 AWS PCS 선택합니다. 여러 서브넷을 선택하면 노드 간 EFA 통신을 사용할 수 없으며 서로 다른 서브넷의 노드 간 통신으로 인해 지연 시간이 늘어날 수 있습니다. 여기서 지정하는 서브넷이 EC2 시작 템플릿에서 정의한 서브넷과 일치하는지 확인합니다.

    6. 인스턴스 - 노드 그룹에서 조정 요청을 이행하려면 인스턴스 유형을 하나 이상 선택합니다. 모든 인스턴스 유형은 프로세서 아키텍처(x864_64 또는 arm64)와 의 수가 동일해야 합니다vCPUs. 인스턴스에 가 있는 경우 GPUs모든 인스턴스 유형은 동일한 수의 를 가져야 합니다GPUs.

    7. 크기 조정 구성 - 노드 그룹의 최소 및 최대 인스턴스 수를 지정합니다. 고정된 수의 노드가 실행되는 정적 구성 또는 최대 수의 노드가 실행될 수 있는 동적 구성을 정의할 수 있습니다. 정적 구성의 경우 최소값과 최대값을 0보다 큰 숫자로 동일하게 설정합니다. 동적 구성의 경우 최소 인스턴스를 0으로 설정하고 최대 인스턴스를 0보다 큰 숫자로 설정합니다. AWS PCS 는 정적 인스턴스와 동적 인스턴스가 혼합된 컴퓨팅 노드 그룹을 지원하지 않습니다.

  5. (선택 사항) 추가 설정에서 다음을 지정합니다.

    1. 구매 옵션 - 스팟 인스턴스와 온디맨드 인스턴스 중에서 선택합니다.

    2. 할당 전략 - 스팟 구매 옵션을 선택한 경우 노드 그룹에서 인스턴스를 시작할 때 스팟 용량 풀을 선택하는 방법을 지정할 수 있습니다. 자세한 내용은 Amazon Elastic Compute Cloud 사용 설명서스팟 인스턴스에 대한 할당 전략을 참조하세요. 온디맨드 구매 옵션을 선택한 경우 이 옵션은 적용되지 않습니다.

  6. (선택 사항) 의 Slurm 사용자 지정 설정 섹션에서 다음 값을 제공합니다.

    1. 가중치 - 이 값은 예약 목적으로 그룹 내 노드의 우선 순위를 설정합니다. 가중치가 낮은 노드는 우선 순위가 높고 단위는 임의적입니다. 자세한 내용은 의 가중치를 참조하세요.Slurm .

    2. 실제 메모리 - 이 값은 노드 그룹의 노드에서 실제 메모리의 크기(GB)를 설정합니다. 클러스터의 CR_CPU_Memory 옵션과 함께 사용하기 위한 것입니다.Slurm 의 구성 AWS PCS. 자세한 내용은 RealMemory 의 섹션을 참조하세요.Slurm .

  7. (선택 사항) 태그 아래에서 컴퓨팅 노드 그룹에 태그를 추가합니다.

  8. 컴퓨팅 노드 그룹 생성을 선택합니다. 노드 그룹을 프로비저닝하는 Creating 동안 AWS PCS 상태 필드가 표시됩니다. 몇 분 정도 걸릴 수 있습니다.

권장 다음 단계
  • 의 AWS PCS 대기열에 노드 그룹을 추가하여 작업을 처리할 수 있도록 합니다.

AWS CLI
를 사용하여 컴퓨팅 노드 그룹을 생성하려면 AWS CLI

다음 명령을 사용하여 대기열을 생성합니다. 명령을 실행하기 전에 다음과 같은 바꾸기를 합니다.

  1. Replace region와 같이 에서 클러스터를 생성하기 AWS 리전 위한 의 ID. us-east-1

  2. Replace my-cluster clusterId클러스터의 이름 또는 를 사용합니다.

  3. Replace my-node-group에 컴퓨팅 노드 그룹의 이름이 있습니다. 이름에는 영숫자(대소문자 구분)와 하이픈만 사용할 수 있습니다. 영문자로 시작해야 하며 25자를 초과할 수 없습니다. 이름은 클러스터 내에서 고유해야 합니다.

  4. Replace subnet-ExampleID1 클러스터 IDs에서 하나 이상의 서브넷이 있는 VPC.

  5. Replace lt-ExampleID1 사용자 지정 시작 템플릿의 ID를 사용합니다. 준비된 항목이 없는 경우 Amazon EC2 시작 템플릿을 다음과 같이 사용하기 AWS PCS를 참조하여 생성 방법을 알아봅니다.

    중요

    AWS PCS 는 각 컴퓨팅 노드 그룹에 대한 관리형 시작 템플릿을 생성합니다. 이름은 입니다pcs-identifier-do-not-delete. 컴퓨팅 노드 그룹을 생성하거나 업데이트할 때 이러한 항목을 선택하지 마세요. 그렇지 않으면 노드 그룹이 제대로 작동하지 않습니다.

  6. Replace launch-template-version 특정 시작 템플릿 버전을 사용합니다. AWS PCS 는 노드 그룹을 시작 템플릿의 특정 버전과 연결합니다.

  7. Replace arn:InstanceProfileIAM 인스턴스 프로필ARN의 를 사용합니다. 준비가 되어 있지 않은 경우 Amazon EC2 시작 템플릿을 다음과 같이 사용하기 AWS PCS 에서 지침을 참조하세요.

  8. Replace min-instances 그리고 max-instances 정수 값을 사용합니다. 고정된 수의 노드가 실행되는 정적 구성 또는 최대 수의 노드가 실행될 수 있는 동적 구성을 정의할 수 있습니다. 정적 구성의 경우 최소값과 최대값을 0보다 큰 숫자로 동일하게 설정합니다. 동적 구성의 경우 최소 인스턴스를 0으로 설정하고 최대 인스턴스를 0보다 큰 숫자로 설정합니다. AWS PCS 는 정적 인스턴스와 동적 인스턴스가 혼합된 컴퓨팅 노드 그룹을 지원하지 않습니다.

  9. Replace t3.large 다른 인스턴스 유형과 함께 사용합니다. instanceType 설정 목록을 지정하여 인스턴스 유형을 더 추가할 수 있습니다. 예: --instance-configs instanceType=c6i.16xlarge,instanceType=c6a.16xlarge. 모든 인스턴스 유형은 프로세서 아키텍처(x864_64 또는 arm64)와 의 수가 동일해야 합니다vCPUs. 인스턴스에 가 있는 경우 GPUs모든 인스턴스 유형에 동일한 수의 가 있어야 합니다GPUs.

aws pcs create-compute-node-group --region region \ --cluster-identifier my-cluster \ --compute-node-group-name my-node-group \ --subnet-ids subnet-ExampleID1 \ --custom-launch-template id=lt-ExampleID1,version='launch-template-version' \ --iam-instance-profile arn=arn:InstanceProfile \ --scaling-config minInstanceCount=min-instances,maxInstanceCount=max-instance \ --instance-configs instanceType=t3.large

create-compute-node-group 명령에 추가할 수 있는 몇 가지 선택적 구성 설정이 있습니다.

  • 사용자 지정 시작 템플릿에 에 대한 참조가 포함되어 있지 않은--amiId지 AMI또는 해당 값을 재정의하려는지 지정할 수 있습니다. 노드 그룹에 AMI 사용되는 는 와 호환되어야 합니다 AWS PCS. 에서 AMI 제공하는 샘플을 선택할 수도 있습니다 AWS. 이 주제에 대한 자세한 내용은 섹션을 참조하세요아마존 머신 이미지 (AMIs) 용 AWS PCS.

  • 를 사용하여 온디맨드(ONDEMAND) 인스턴스와 스팟(SPOT) 인스턴스 중에서 선택할 수 있습니다--purchase-option. 온디맨드가 기본값입니다. 스팟 인스턴스를 선택하는 경우 --allocation-strategy를 사용하여 가 노드 그룹에서 인스턴스를 시작할 때 스팟 용량 풀을 선택하는 방법을 AWS PCS 정의할 수도 있습니다. 자세한 내용은 Amazon Elastic Compute Cloud 사용 설명서스팟 인스턴스에 대한 할당 전략을 참조하세요.

  • 를 제공할 수 있습니다.Slurm 를 사용하는 노드 그룹의 노드에 대한 구성 옵션입니다--slurm-configuration. 가중치(일정 우선순위)와 실제 메모리를 설정할 수 있습니다. 가중치가 낮은 노드는 우선 순위가 높고 단위는 임의적입니다. 자세한 내용은 의 가중치를 참조하세요.Slurm . 실제 메모리는 노드 그룹의 노드에서 실제 메모리의 크기(GB)를 설정합니다. 이는 의 에서 AWS PCS 클러스터에 대한 CR_CPU_Memory 옵션과 함께 사용하기 위한 것입니다.Slurm 구성. 자세한 내용은 RealMemory 의 섹션을 참조하세요.Slurm .

중요

컴퓨팅 노드 그룹을 생성하는 데 몇 분 정도 걸릴 수 있습니다.

다음 명령을 사용하여 노드 그룹의 상태를 쿼리할 수 있습니다. 상태가 에 도달할 때까지 노드 그룹을 대기열과 연결할 수 없습니다ACTIVE.

aws pcs get-compute-node-group --region region \ --cluster-identifier my-cluster \ --compute-node-group-identifier my-node-group