本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。
[queue]
部分
定义单个队列的配置设置。 [queue]
仅当设置scheduler为时才支持@@ 分区slurm
。
格式是[queue
。 <queue-name>
]队列名称
必须以小写字母开头,包含不超过 30 个字符,并且只能包含小写字母、数字和连字符 (-)。
[queue q1] compute_resource_settings = i1,i2 placement_group = DYNAMIC enable_efa = true disable_hyperthreading = false compute_type = spot
注意
AWS ParallelCluster版本 2.9.0 中增加了对该[queue]部分的Support。
主题
compute_resource_settings
(必需)标识包含此队列的计算资源配置的[compute_resource]部分。分区名称必须以字母开头,并且包含不超过 30 个字符,并且只能包含字母、数字、连字符 (-) 和下划线 (_)。
每个[compute_resource]部分最多支持三 (3) 个[queue]部分。
例如,以下设置指定了开头[compute_resource cr1]
和[compute_resource cr2]
使用的部分。
compute_resource_settings = cr1, cr2
compute_type
(可选)定义要为此队列启动的实例类型。该设置替代 cluster_type 设置。
有效的选项为:ondemand
和 spot
。
默认值为 ondemand
。
有关 Spot 实例的更多信息,请参阅 使用竞价型实例。
注意
使用 Spot 实例,要求您的账户中存在AWSServiceRoleForEC2Spot
服务相关角色。要使用账户中在账户中,AWS CLI
aws iam create-service-linked-role --aws-service-name spot.amazonaws.com
有关更多信息,请参阅《适用于 Linux 实例的 Amazon EC2 用户指南》中的竞价型实例请求的服务相关角色。
以下示例使用 SpotInstances 此队列中的计算节点。
compute_type = spot
disable_hyperthreading
(可选)在此队列中的节点上禁用超线程。并非所有实例类型都可以禁用超线程。有关支持禁用超线程的实例类型的列表,请参阅 Amazon EC2 Linux 实例用户指南中每种实例类型的 CPU 核心和线程。如果定义了[cluster]分区中的disable_hyperthreading设置,则无法定义此设置。
默认值为 false
。
disable_hyperthreading = true
enable_efa
(可选)如果设置为true
,则指定为该队列中的节点启用Elastic Fabric Adapter (EFA)。要查看支持 EFA 的 EC2 实例列表,请参阅 Amazon EC2 Linux 实例用户指南中支持的实例类型。如果定义了[cluster]分区中的enable_efa设置,则无法定义此设置。应使用集群置放群组来最大限度地减少实例之间的延迟。有关更多信息,请参阅 placement 和 placement_group。
enable_efa = true
enable_efa_gdr
(可选)从AWS ParallelCluster版本 2.11.3 开始,此设置无效。如果实例类型支持 GpuDirect RDMA(远程直接内存访问),则计算节点的Elastic Fabric Adapter (EFA) FA) 支持始终处于启用状态。
注意
AWS ParallelCluster版本 2.10.0 到 2.11.2:如果true
是,则指定为该队列中的节点启用弹性结构适配器 (EFA) GPUDirect RDMA(远程直接内存访问)。将其设置为true
需要将enable_efa设置设置设置为true
.EFA GpuDirect RDMA,这些操作系统上的以下实例类型 (p4d.24xlarge
)(alinux2
、centos7
ubuntu1804
、或ubuntu2004
)都支持。如果定义了[cluster]分区中的enable_efa_gdr设置,则无法定义此设置。应使用集群置放群组来最大限度地减少实例之间的延迟。有关更多信息,请参阅 placement 和 placement_group。
默认值为 false
。
enable_efa_gdr = true
注意
AWS ParallelCluster版本 2.10.0 中增加了对enable_efa_gdr
的Support。
placement_group
(可选)如果存在,则定义此队列的置放组。该设置替代 placement_group 设置。
有效选项为以下值:
-
DYNAMIC
-
现有的 Amazon EC2 集群置放群组名称
设置为时DYNAMIC
,将为该队列创建一个唯一的置放群组,并将其作为集群堆栈的一部分删除。
有关置放群组的更多信息,请参阅《适用于 Linux 实例的 Amazon EC2 用户指南》中的置放群组。如果将同一个置放群组用于不同的实例类型,则请求更有可能由于容量不足错误而失败。有关更多信息,请参阅《适用于 Linux 实例的 Amazon EC2 用户指南》中的实例容量不足。
没有默认值。
并非所有实例类型都支持集群置放群组。例如,t2.micro
不支持集群置放群组。有关支持集群组中支持集群组的信息,请参阅《适用于 Linux 实例的 Amazon EC2 用户指南》中的集群组规则和限制。有关使用置放群组时的提示,请参阅置放群组和实例启动问题。
placement_group = DYNAMIC