Allocazione di più tipi di istanza con Slurm - AWS ParallelCluster

Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.

Allocazione di più tipi di istanza con Slurm

A partire daAWS ParallelClusternella versione 3.3.0, puoi configurare il cluster per l'allocazione dal set di tipi di istanza definiti di una risorsa di calcolo. L'allocazione può essere basata su strategie a basso costo o sulla capacità ottimale della flotta EC2.

Questo set di tipi di istanze definiti deve avere tutti lo stesso numero di vCPU o, se il multithreading è disabilitato, lo stesso numero di core. Inoltre, questo set di tipi di istanze deve avere lo stesso numero di acceleratori degli stessi produttori. SeEfa/Enabledè impostato sutrue, le istanze devono avere il supporto EFA. Per ulteriori informazioni e requisiti, vedereScheduling/SlurmQueues/AllocationStrategyeComputeResources/Instances.

È possibile impostareAllocationStrategyalowest-priceocapacity-optimizeda seconda del tuoCapacityTypeconfigurazione.

InInstances, puoi configurare un set di tipi di istanze.

Nota

A partire daAWS ParallelClusterversione 3.7.0,EnableMemoryBasedSchedulingpuò essere abilitato se si configurano più tipi di istanza inIstanze.

PerAWS ParallelClusterversioni da 3.2.0 a 3.6.x,EnableMemoryBasedSchedulingnon può essere abilitato se configuri più tipi di istanza inIstanze.

Gli esempi seguenti mostrano come è possibile interrogare i tipi di istanza per vCPU, supporto EFA e architettura.

QueryInstanceTypescon 96 vCPU e architettura x86_64.

$ aws ec2 describe-instance-types --region region-id \ --filters "Name=vcpu-info.default-vcpus,Values=96" "Name=processor-info.supported-architecture,Values=x86_64" \ --query "sort_by(InstanceTypes[*].{InstanceType:InstanceType,MemoryMiB:MemoryInfo.SizeInMiB,CurrentGeneration:CurrentGeneration,VCpus:VCpuInfo.DefaultVCpus,Cores:VCpuInfo.DefaultCores,Architecture:ProcessorInfo.SupportedArchitectures[0],MaxNetworkCards:NetworkInfo.MaximumNetworkCards,EfaSupported:NetworkInfo.EfaSupported,GpuCount:GpuInfo.Gpus[0].Count,GpuManufacturer:GpuInfo.Gpus[0].Manufacturer}, &InstanceType)" \ --output table

QueryInstanceTypescon 64 core, supporto EFA e architettura arm64.

$ aws ec2 describe-instance-types --region region-id \ --filters "Name=vcpu-info.default-cores,Values=64" "Name=processor-info.supported-architecture,Values=arm64" "Name=network-info.efa-supported,Values=true" --query "sort_by(InstanceTypes[*].{InstanceType:InstanceType,MemoryMiB:MemoryInfo.SizeInMiB,CurrentGeneration:CurrentGeneration,VCpus:VCpuInfo.DefaultVCpus,Cores:VCpuInfo.DefaultCores,Architecture:ProcessorInfo.SupportedArchitectures[0],MaxNetworkCards:NetworkInfo.MaximumNetworkCards,EfaSupported:NetworkInfo.EfaSupported,GpuCount:GpuInfo.Gpus[0].Count,GpuManufacturer:GpuInfo.Gpus[0].Manufacturer}, &InstanceType)" \ --output table

Il prossimo esempio di frammento di configurazione del cluster mostra come utilizzarliInstanceTypeeAllocationStrategyproprietà.

... Scheduling: Scheduler: slurm SlurmQueues: - Name: queue-1 CapacityType: ONDEMAND AllocationStrategy: lowest-price ... ComputeResources: - Name: computeresource1 Instances: - InstanceType: r6g.2xlarge - InstanceType: m6g.2xlarge - InstanceType: c6g.2xlarge MinCount: 0 MaxCount: 500 - Name: computeresource2 Instances: - InstanceType: m6g.12xlarge - InstanceType: x2gd.12xlarge MinCount: 0 MaxCount: 500 ...