Asignación de varios tipos de instancias con Slurm - AWS ParallelCluster

Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.

Asignación de varios tipos de instancias con Slurm

A partir deAWS ParallelCluster la versión 3.3.0, puedes configurar tu clúster para que asigne desde el conjunto de tipos de instancias definidos de un recurso de cómputo. La asignación se puede basar en estrategias de bajo costo o de capacidad óptima de la flota de EC2.

Este conjunto de tipos de instancias definidos debe tener todos el mismo número de vCPUs o, si el subproceso múltiple está desactivado, el mismo número de núcleos. Además, este conjunto de tipos de instancias debe tener el mismo número de aceleradores de los mismos fabricantes. Si Efa/Enabledse establece entrue, las instancias deben ser compatibles con EFA. Para obtener más información y requisitos, consulte SchedulingSlurmQueues/AllocationStrategyy ComputeResources/Instances.

Puede AllocationStrategyconfigurarlo enlowest-price o encapacity-optimized función de su CapacityTypeconfiguración.

En Instances, puede configurar un conjunto de tipos de instancias.

nota

EnableMemoryBasedSchedulingno se puede habilitar si configuras varios tipos de instancias en Instances.

Los siguientes ejemplos muestran cómo puede utilizar para consultar los tipos de instancias para las vCPUs, la compatibilidad con EFA y la arquitectura.

ConsultaInstanceTypes con 96 vCPUs y arquitectura x86_64.

$ aws ec2 describe-instance-types --region region-id \ --filters "Name=vcpu-info.default-vcpus,Values=96" "Name=processor-info.supported-architecture,Values=x86_64" \ --query "sort_by(InstanceTypes[*].{InstanceType:InstanceType,MemoryMiB:MemoryInfo.SizeInMiB,CurrentGeneration:CurrentGeneration,VCpus:VCpuInfo.DefaultVCpus,Cores:VCpuInfo.DefaultCores,Architecture:ProcessorInfo.SupportedArchitectures[0],MaxNetworkCards:NetworkInfo.MaximumNetworkCards,EfaSupported:NetworkInfo.EfaSupported,GpuCount:GpuInfo.Gpus[0].Count,GpuManufacturer:GpuInfo.Gpus[0].Manufacturer}, &InstanceType)" \ --output table

ConsultaInstanceTypes con 64 núcleos, compatibilidad con EFA y arquitectura arm64.

$ aws ec2 describe-instance-types --region region-id \ --filters "Name=vcpu-info.default-cores,Values=64" "Name=processor-info.supported-architecture,Values=arm64" "Name=network-info.efa-supported,Values=true" --query "sort_by(InstanceTypes[*].{InstanceType:InstanceType,MemoryMiB:MemoryInfo.SizeInMiB,CurrentGeneration:CurrentGeneration,VCpus:VCpuInfo.DefaultVCpus,Cores:VCpuInfo.DefaultCores,Architecture:ProcessorInfo.SupportedArchitectures[0],MaxNetworkCards:NetworkInfo.MaximumNetworkCards,EfaSupported:NetworkInfo.EfaSupported,GpuCount:GpuInfo.Gpus[0].Count,GpuManufacturer:GpuInfo.Gpus[0].Manufacturer}, &InstanceType)" \ --output table

El siguiente ejemplo de fragmento de configuración de clúster muestra cómo puede utilizar estasInstanceType y otrasAllocationStrategy propiedades.

... Scheduling: Scheduler: slurm SlurmQueues: - Name: queue-1 CapacityType: ONDEMAND AllocationStrategy: lowest-price ... ComputeResources: - Name: computeresource1 Instances: - InstanceType: r6g.2xlarge - InstanceType: m6g.2xlarge - InstanceType: c6g.2xlarge MinCount: 0 MaxCount: 500 - Name: computeresource2 Instances: - InstanceType: m6g.12xlarge - InstanceType: x2gd.12xlarge MinCount: 0 MaxCount: 500 ...