Sección [queue] - AWS ParallelCluster

Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.

Sección [queue]

Define los valores de configuración de una sola cola.[queue]Seccionessolo se admiten cuandoschedulertoma el valorslurm.

El formato es[queue <queue-name>].nombre-coladebe comenzar por una minúscula, no puede contener más de 30 caracteres y solo puede contener letras minúsculas, números y guiones (-).

[queue q1] compute_resource_settings = i1,i2 placement_group = DYNAMIC enable_efa = true disable_hyperthreading = false compute_type = spot
nota

Support con la[queue]Secciónse ha añadido enAWS ParallelClusterversión 2.9.0.

compute_resource_settings

(Obligatorio)Identifica el[compute_resource]Seccionesque contiene las configuraciones de recursos informáticos para esta cola. Los nombres de las secciones debe comenzar por una letra, no puede contener más de 30 caracteres y solo puede contener letras, números, guiones (-) y guiones (_).

Hasta tres (3)[compute_resource]Seccionesson compatibles para cada[queue]Sección.

Por ejemplo, la siguiente configuración especifica que las secciones que comienzan[compute_resource cr1]y[compute_resource cr2]se utilizan.

compute_resource_settings = cr1, cr2

Política de actualización: si se cambia esta configuración, la actualización no está permitida.

compute_type

(Opcional)Define el tipo de instancias que se van a lanzar para esta cola. Esta configuración reemplaza la configuración cluster_type.

Las opciones válidas son: ondemand y spot.

El valor predeterminado es ondemand.

Para obtener más información acerca de las instancias de Spot, consulte Uso de Instancias de spot.

nota

El uso de instancias de spot requiere que elAWSServiceRoleForEC2Spotexiste un rol vinculado al servicio en su cuenta. Para crear este rol en una cuenta con laAWS CLI, ejecute el siguiente comando:

aws iam create-service-linked-role --aws-service-name spot.amazonaws.com

Para obtener más información, consulteRol vinculado al servicio para solicitudes de instancias de spoten laGuía del usuario de Amazon EC2 para instancias de Linux.

El siguiente ejemplo utiliza SpotInstances para los nodos de procesamiento de esta cola.

compute_type = spot

Política de actualización: la flota de procesamiento debe estar detenida para poder cambiar esta configuración para una actualización.

disable_hyperthreading

(Opcional)Deshabilita la tecnología Hyper-Threading en los nodos de esta cola. No todos los tipos de instancias pueden deshabilitar la tecnología Hyper-Threading. Para obtener una lista de los tipos de instancias que admiten la deshabilitación de Hyper-Threading, consulteNúcleos de CPU y subprocesos para cada núcleo de CPU por tipo de instanciaen laGuía del usuario de Amazon EC2 para instancias de Linux. Si el archivo dedisable_hyperthreadingambientación en el[cluster]Secciónestá definido, esta configuración no se puede definir.

El valor predeterminado es false.

disable_hyperthreading = true

Política de actualización: la flota de procesamiento debe estar detenida para poder cambiar esta configuración para una actualización.

enable_efa

(Opcional)Si se establece entrue, especifica que Elastic Fabric Adapter (EFA) se ha habilitado para los nodos de esta cola. Para ver la lista de instancias de EC2 que admiten EFA, consulteTipos de instancias admitidosen laGuía del usuario de Amazon EC2 para instancias de Linux. Si el archivo deenable_efaambientación en el[cluster]Secciónestá definido, esta configuración no se puede definir. Se debe utilizar un grupo de ubicación del clúster para minimizar las latencias entre instancias. Para obtener más información, consulte placement y placement_group.

enable_efa = true

Política de actualización: la flota de procesamiento debe estar detenida para poder cambiar esta configuración para una actualización.

enable_efa_gdr

(Opcional)A partir deAWS ParallelClusterversión 2.11.3, este ajuste no tiene ningún efecto. La compatibilidad con Elastic Fabric Adapter (EFA) para GPUDirect RDMA (acceso directo a memoria) está habilitada para los nodos de procesamiento siempre está habilitada si es compatible con el tipo de instancia.

nota

AWS ParallelClusterversión 2.10.0 a 2.11.2: Sitrue, especifica que Elastic Fabric Adapter (EFA) GPUDirect RDMA (acceso a memoria) se ha habilitado para los nodos de esta cola. Estableciendo esto entruerequiere que elenable_efase ha establecido entrue.EFA GPUDirect RDMA es compatible con los siguientes tipos de instancias (p4d.24xlarge) en estos sistemas operativos (alinux2,centos7,ubuntu1804, o bienubuntu2004). Si el archivo deenable_efa_gdrambientación en el[cluster]Secciónestá definido, esta configuración no se puede definir. Se debe utilizar un grupo de ubicación del clúster para minimizar las latencias entre instancias. Para obtener más información, consulte placement y placement_group.

El valor predeterminado es false.

enable_efa_gdr = true
nota

Compatibilidad conenable_efa_gdrse ha añadido enAWS ParallelClusterversión 2.10.0.

Política de actualización: la flota de procesamiento debe estar detenida para poder cambiar esta configuración para una actualización.

placement_group

(Opcional)Si está presente, define el grupo de ubicación de esta cola. Esta configuración reemplaza la configuración placement_group.

Las opciones válidas son los valores siguientes:

  • DYNAMIC

  • Un nombre de grupo de ubicación del clúster de Amazon EC2

Cuando se establece enDYNAMIC, se crea y elimina un grupo de ubicación único para esta cola como parte de la pila de clúster.

Para obtener más información acerca de los grupos de ubicación, consulteGrupos de ubicaciónen laGuía del usuario de Amazon EC2 para instancias de Linux. Si se usa el mismo grupo de ubicación para diferentes tipos de instancias, es más probable que la solicitud falle debido a un error de capacidad insuficiente. Para obtener más información, consulteCapacidad de la instancia insuficienteen laGuía del usuario de Amazon EC2 para instancias de Linux.

No hay valor predeterminado.

No todos los tipos de instancias admiten grupos de ubicación en clúster. Por ejemplo,t2.microno admite grupos de ubicación en clúster. Para obtener información acerca de la lista de tipos de instancias que admiten grupos de ubicación en clúster, consulteReglas y limitaciones de los grupos de ubicación en clústeren laGuía del usuario de Amazon EC2 para instancias de Linux. Consulte Problemas de lanzamiento de instancias y grupos de ubicación para obtener sugerencias al trabajar con grupos de ubicación.

placement_group = DYNAMIC

Política de actualización: la flota de procesamiento debe estar detenida para poder cambiar esta configuración para una actualización.