[compute_resource] 部分 - AWS ParallelCluster

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

[compute_resource] 部分

定义计算资源的配置设置。 [compute_resource]部分由该[queue]部分中的compute_resource_settings设置引用。 [compute_resource]仅当设置scheduler为时才支持@@ 分区slurm

格式为 [compute_resource <compute-resource-name>]compute-resource-name必须以字母开头,并且只能包含字母、数字、连字符 (-) 和下划线 (_)。

[compute_resource cr1] instance_type = c5.xlarge min_count = 0 initial_count = 2 max_count = 10 spot_price = 0.5
注意

AWS ParallelCluster版本 2.9.0 中增加了对该[compute_resource]部分的Support。

initial_count

(可选)设置要为此计算资源启动的 Amazon EC2 实例的初始数量。直到至少向计算资源启动了这么多节点后,集群的创建才会完成。如果队列的compute_type设置为,spot并且没有足够的竞价型实例可用,则集群创建可能会超时并失败。任何大于min_count设置的计数都是动态容量,具体视scaledown_idletime设置而定。该设置替代 initial_queue_size 设置。

默认值为 0

initial_count = 2

更新策略:必须停止计算队列才能更改此设置以进行更新。

instance_type

(必需)定义用于此计算资源的 Amazon EC2 实例类型。实例类型的架构必须与用于master_instance_type设置的架构相同。分[compute_resource]区引用的每个部分的instance_type设置必须是[queue]唯一的。该设置替代 compute_instance_type 设置。

instance_type = t2.micro

更新策略:必须停止计算队列才能更改此设置以进行更新。

max_count

(可选)设置可以在此计算资源中启动的最大 Amazon EC2 实例数。任何大于initial_count设置的计数都将在断电模式下启动。该设置替代 max_queue_size 设置。

默认值为 10

max_count = 10

更新策略:要将队列的大小减少到当前节点数以下,需要先停止计算队列。

注意

在 2.0.0 到 2.9.1AWS ParallelCluster 版本的计算队列停止之前,更新策略不支持更改max_count设置。

min_count

(可选)设置可以在此计算资源中启动的 Amazon EC2 实例最小数量。这些节点都是静态容量。直到将至少这个数量的节点启动到计算资源中,集群创建才会完成。

默认值为 0

min_count = 1

更新策略:减少队列中静态节点的数量需要先停止计算队列。

注意

在 2.0.0 到 2.9.1AWS ParallelCluster 版本的计算队列停止之前,更新策略不支持更改min_count设置。

spot_price

(可选)设置此计算资源的最高现货价格。仅在compute_type包含此计算资源的队列的设置设置为时使用spot。该设置替代 spot_price 设置。

如果您未指定值,将按现货价格向您收费,上限为按需价格。

要获得有关查找满足您需求的竞价型实例的帮助,请咨询竞价型实例顾问

spot_price = 1.50

更新策略:必须停止计算队列才能更改此设置以进行更新。