本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。
[cluster]
部分
定义可用于创建集群的集群模板。一个配置文件可以包含多个[cluster]
部分。
相同的集群模板可用于创建多个集群。
格式为 [cluster
。默认情况下,使用分[global]区中cluster_template设置命名的[cluster]部分,但可以在pcluster命令行上覆盖。cluster-template-name
]
cluster-template-name
必须以字母开头,并且仅包含字母、数字、连字符 (-) 和下划线 (_)。
[cluster default]
主题
- additional_cfn_template
- additional_iam_policies
- base_os
- cluster_resource_bucket
- cluster_type
- compute_instance_type
- compute_root_volume_size
- custom_ami
- cw_log_settings
- dashboard_settings
- dcv_settings
- desired_vcpus
- disable_cluster_dns
- disable_hyperthreading
- ebs_settings
- ec2_iam_role
- efs_settings
- enable_efa
- enable_efa_gdr
- enable_intel_hpc_platform
- encrypted_ephemeral
- ephemeral_dir
- extra_json
- fsx_settings
- iam_lambda_role
- initial_queue_size
- key_name
- maintain_initial_size
- master_instance_type
- master_root_volume_size
- max_queue_size
- max_vcpus
- min_vcpus
- placement
- placement_group
- post_install
- post_install_args
- pre_install
- pre_install_args
- proxy_server
- queue_settings
- raid_settings
- s3_read_resource
- s3_read_write_resource
- scaling_settings
- scheduler
- shared_dir
- spot_bid_percentage
- spot_price
- tags
- template_url
- vpc_settings
additional_cfn_template
(可选)定义与集群一起启动的附加AWS CloudFormation模板。此附加模板用于创建集群之外但属于集群生命周期一部分的资源。
该值必须是公共模板的 HTTP URL,并提供所有参数。
没有默认值。
additional_cfn_template = https://
<bucket-name>
.s3.amazonaws.com/my-cfn-template.yaml
additional_iam_policies
(可选)指定 Amazon EC2 的 IAM 策略的Amazon 资源名称(ARN)的列表。除了用逗号AWS ParallelCluster分隔所需的权限外,此列表还附加到集群中使用的根角色。IAM 策略名称和其 ARN 是不同的。名称不能用作参数additional_iam_policies
。
如果您的意图是向集群节点的默认设置添加额外策略,我们建议您在设置中传递额外的自定义 IAM 策略,而不是使用ec2_iam_role设置来添加您的特定 EC2 策略。additional_iam_policies
这是因为additional_iam_policies
已添加到AWS ParallelCluster所需的默认权限中。现有ec2_iam_role必须包含所需的所有权限。但是,由于所需的权限通常会随着功能的添加而随版本而变化,因此现有权限ec2_iam_role可能会过时。
没有默认值。
additional_iam_policies = arn:aws:iam::123456789012:policy/
CustomEC2Policy
注意
AWS ParallelCluster版本 2.5.0 additional_iam_policies中添加了对的Support。
base_os
(必需)指定在集群中使用的操作系统类型。
可用的选项为:
-
alinux2
-
centos7
-
ubuntu1804
-
ubuntu2004
注意
对于AWS基于 Graviton 的实例alinux2
ubuntu1804
,ubuntu2004
仅支持、或。
注意
centos8
在 2.11.4AWS ParallelCluster 版本中删除了对的Support。ubuntu2004
在 2.11.0AWS ParallelCluster 版本中添加了对的Salinux
uubuntu1604
pport,并删除了对和的支持。centos8
在 2.10.0AWS ParallelCluster 版本中添加了对的Scentos6
upport 并删除了对的支持。AWS ParallelCluster版本 2.6.0 中添加了对的Support。alinux2
ubuntu1804
在 2.5.0AWS ParallelCluster 版本中添加了对的Suppubuntu1404
ort,并删除了对的支持。
除了下表中AWS 区域提到的不支持的具体内容外centos7
。所有其他AWS商业区域支持以下所有操作系统。
分区 (AWS 区域) | alinux2 |
centos7 |
ubuntu1804 和 ubuntu2004 |
---|---|---|---|
商业(均AWS 区域未特别提及) | True | True | True |
AWS GovCloud (美国东部)(us-gov-east-1 ) |
True | False | True |
AWS GovCloud (美国西部)(us-gov-west-1 ) |
True | False | True |
中国(北京) (cn-north-1 ) |
True | False | True |
中国(宁夏) (cn-northwest-1 ) |
True | False | True |
注意
该base_os参数还确定用于登录集群的用户名。
-
centos7
:centos
-
ubuntu1804
和ubuntu2004
:ubuntu
-
alinux2
:ec2-user
注意
在AWS ParallelCluster版本 2.7.0 之前,该base_os参数是可选的,默认值为alinux
。从AWS ParallelCluster版本 2.7.0 开始,该base_os参数是必填的。
注意
如果 scheduler 参数为 awsbatch
,则仅支持 alinux2
。
base_os = alinux2
cluster_resource_bucket
(可选)指定用于托管创建集群时生成的资源的 Amazon S3 存储桶的名称。存储桶必须已启用版本控制。有关更多信息,请参阅 Amazon Simple Storage Service 用户指南中的使用版本控制。此存储桶可用于多个集群。存储桶必须与集群同在一个区域中。
如果未指定此参数,则在创建集群时创建一个新的存储桶。新存储段的名称为parallelcluster-
。在这个名称中,r random_string
andom_strin
g 是一个由字母数字字符组成的随机字符串。所有集群资源都存储在此存储桶中,路径格式为
。 bucket_name
/resource_directory
resource_directory
格式为
,其中 stack_name
-random_string
stack_
name 是使用的其中一个AWS CloudFormation堆栈的名称AWS ParallelCluster。bucket_name
的ResourcesS3Bucket
值可以在parallelcluster-
堆栈输出中的值中找到。clustername
resource_directory
的值可以在同一堆栈的ArtifactS3RootDirectory
输出值中找到。
默认值为 parallelcluster-
。random_string
cluster_resource_bucket = my-s3-bucket
注意
AWS ParallelCluster版本 2.2.2.2.2.0 中添加了对的Support。cluster_resource_bucket
更新策略:如果更改此设置,则不允许更新。无法强制更新此设置。
cluster_type
(可选)定义要启动的集群类型。如果定义了queue_settings设置,则必须将此设置替换为[queue]部分中的compute_type设置。
有效的选项为:ondemand
和 spot
。
默认值为 ondemand
。
有关 Spot 实例的更多信息,请参阅 使用竞价型实例。
注意
使用 Spot 实例要求您的账户中存在AWSServiceRoleForEC2Spot
服务相关角色。要使用在账户中创建此角色AWS CLI,请运行以下命令:
aws iam create-service-linked-role --aws-service-name spot.amazonaws.com
有关更多信息,请参阅适用于 Linux 实例的 Amazon EC2 用户指南中的竞价型实例请求的服务相关角色。
cluster_type = ondemand
compute_instance_type
(可选)定义用于集群计算节点的 Amazon EC2 实例类型。实例类型的架构必须与用于master_instance_type设置的架构相同。如果定义了queue_settings设置,则必须将此设置替换为[compute_resource]部分中的instance_type设置。
如果您使用awsbatch
调度程序,请参阅AWS Batch用户界面中的计算环境创建,了解支持的实例类型列表。
默认值为 t2.micro
;当计划程序为 awsbatch
时,为 optimal
。
compute_instance_type = t2.micro
注意
AWS ParallelCluster版本 2.8.0 中添加了对AWS基于 Graviton 的C6g
实例(包括A1
和实例)的Support。
compute_root_volume_size
(可选) ComputeFleet 以 Gibibibyte(GiB)(GiB)(GiB)(GiB) AMI 必须支持 growroot
。
默认值为 35
。
注意
对于 2.5.0 和 2.10.4 之间的AWS ParallelCluster版本,默认值为 25。AWS ParallelCluster版本 2.2.2.版本 2.2.2.5.0 之前的版本
compute_root_volume_size = 35
custom_ami
(可选)指定用于头节点和计算节点的自定义 AMI 的 ID,而不是默认已发布的 AMI
没有默认值。
custom_ami = ami-00d4efc81188687a0
如果自定义 AMI 需要额外权限才能启动,则必须将这些权限添加到用户和头节点策略中。
例如,如果自定义 AMI 有与之关联的加密快照,则在用户和头节点策略中都需要以下附加策略:
{ "Version": "2012-10-17", "Statement": [ { "Effect": "Allow", "Action": [ "kms:DescribeKey", "kms:ReEncrypt*", "kms:CreateGrant", "kms:Decrypt" ], "Resource": [ "arn:aws:kms:
<AWS_REGION>
:<AWS_ACCOUNT_ID>
:key/<AWS_KMS_KEY_ID>
" ] } ] }
cw_log_settings
(可选)使用 CloudWatch 日志配置标识该[cw_log]
部分。分区名称必须以字母开头,并且仅包含字母、数字、连字符 (-) 和下划线 (_)。
有关更多信息,请参阅亚马逊CloudWatch控制面板、和[cw_log]部分与 AmazonCloudWatch Logs。
例如,以下设置指定起始部分[cw_log custom-cw]
用于 CloudWatch 日志配置。
cw_log_settings = custom-cw
注意
AWS ParallelCluster版本 2.6.0 中添加了对的Support。cw_log_settings
dashboard_settings
(可选)使用 CloudWatch仪表板配置标识分[dashboard]
区。分区名称必须以字母开头,并且仅包含字母、数字、连字符 (-) 和下划线 (_)。
有关更多信息,请参阅[dashboard]部分。
例如,以下设置指定起始部分[dashboard
custom-dashboard
用于 CloudWatch 仪表板配置。
dashboard_settings = custom-dashboard
注意
AWS ParallelCluster版本 2.2.2.2.2.0 中添加了对的Support。dashboard_settings
dcv_settings
(可选)使用 NICE DCV 配置标识该[dcv]
部分。分区名称必须以字母开头,并且仅包含字母、数字、连字符 (-) 和下划线 (_)。
有关更多信息,请参阅[dcv]部分。
例如,以下设置指定起始部分用[dcv custom-dcv]
于 NICE DCV 配置。
dcv_settings = custom-dcv
注意
在AWS基于 Graviton 的实例上,仅支持 NICE DCValinux2
。
注意
AWS ParallelCluster版本 2.5.0dcv_settings 中添加了对的Support。
desired_vcpus
(可选)指定计算环境中所需的 vCPUs 数量。仅在计划程序为 awsbatch
时使用。
默认值为 4
。
desired_vcpus = 4
disable_cluster_dns
(可选)指定是否不应为集群创建 DNS 条目。默认情况下,AWS ParallelCluster创建 Route 53 托管区域。如果设置disable_cluster_dns
为true
,则不创建托管区域。
默认值为 false
。
disable_cluster_dns = true
警告
集群需要名称解析系统才能正常运行。如果设置disable_cluster_dns
为true
,则还必须提供额外的名称解析系统。
重要
disable_cluster_dns=true
仅在指定queue_settings设置时才支持。
注意
AWS ParallelCluster版本 2.9.1disable_cluster_dns 中添加了对的Support。
disable_hyperthreading
(可选)在头部和计算节点上禁用超线程。并非所有实例类型都可以禁用超线程。有关支持禁用超线程的实例类型的列表,请参阅 Amazon EC2 Linux 实例用户指南中每种实例类型的 CPU 核心和线程。如果定义了queue_settings设置,则可以定义此disable_hyperthreading设置,也可以定义[queue]部分中的设置。
默认值为 false
。
disable_hyperthreading = true
注意
disable_hyperthreading仅在以下情况下影响头节点scheduler = awsbatch
。
注意
AWS ParallelCluster版本 2.5.0disable_hyperthreading 中添加了对的Support。
ebs_settings
(可选)标识安装在头节点上的 Amazon EBS 卷的[ebs]
部分。使用多个 Amazon EBS 卷时,在列表中输入这些参数,每个参数用逗号分隔。分区名称必须以字母开头,并且仅包含字母、数字、连字符 (-) 和下划线 (_)。
最多支持五(5)个额外的 Amazon EBS 卷。
有关更多信息,请参阅[ebs]部分。
例如,以下设置指定了 Amazon EBS 卷的起始部分[ebs custom1]
和用[ebs custom2]
于 Amazon EBS 卷。
ebs_settings = custom1, custom2
ec2_iam_role
(可选)为连接到集群中所有实例的 Amazon EC2 定义现有 IAM 角色的名称。IAM 角色名称及其 Amazon 资源名称 (ARN) 是不同的。ARN 不能用作的参数ec2_iam_role
。
如果指定了此选项,则忽略 additional_iam_policies 设置。如果您的意图是向集群节点的默认设置添加额外策略,我们建议您将其他自定义 IAM 策略与additional_iam_policies设置一起传递,而不是使用ec2_iam_role
设置。
如果未指定此选项,则使用 Amazon EC2 的默认AWS ParallelCluster IAM 角色。有关更多信息,请参阅AWS Identity and Access Management中的角色AWS ParallelCluster:
没有默认值。
ec2_iam_role = ParallelClusterInstanceRole
efs_settings
(可选)指定与 Amazon EFS 文件系统相关的设置。分区名称必须以字母开头,并且仅包含字母、数字、连字符 (-) 和下划线 (_)。
有关更多信息,请参阅[efs]部分。
例如,以下设置指定起始部分用[efs customfs]
于 Amazon EFS 文件系统配置。
efs_settings = customfs
enable_efa
(可选)如果存在,则指定为计算节点启用Elastic Fabric Adapter (EFA)。要查看支持 EFA 的 EC2 实例列表,请参阅 Amazon EC2 Linux 实例用户指南中支持的实例类型。有关更多信息,请参阅Elastic Fabric Adapter:如果定义了queue_settings设置,则可以定义此enable_efa设置,也可以定义该[queue]部分中的设置。应使用集群置放群组来最大限度地减少实例之间的延迟。有关更多信息,请参阅 placement 和 placement_group。
enable_efa = compute
注意
AWS ParallelCluster版本 2.10.1 中增加了对基于 ARM 的 Graviton2 实例上的 EFA 的Support。
enable_efa_gdr
(可选)从AWS ParallelCluster版本 2.11.3 开始,此设置无效。如果实例类型和操作系统都支持 GpuDirect RDMA(远程直接内存访问)的 Elastic Fabric Adapter (EFA) 支持,则始终处于启用状态。
注意
AWS ParallelCluster版本 2.10.0 到 2.11.2:如果compute
为,则指定计算节点启用弹性结构适配器 (EFA) 对 GPUDirect RDMA(远程直接内存访问)的支持。将此设置设置设置为compute
需要将该enable_efa设置设置设置为compute
。特定操作系统上的特定实例类型 (p4d.24xlarge
) 支持 GPUDirect RDMA 的 EFA 支持(base_oscentos7
即alinux2
ubuntu1804
、、或ubuntu2004
)。如果定义了queue_settings设置,则可以定义此enable_efa_gdr设置,也可以定义[queue]部分中的设置。应使用集群置放群组来最大限度地减少实例之间的延迟。有关更多信息,请参阅 placement 和 placement_group。
enable_efa_gdr = compute
注意
AWS ParallelCluster版本 2.2.2.2.2.0 中添加了对的Support。enable_efa_gdr
enable_intel_hpc_platform
(可选)如果存在,则表示接受英特尔 Parallel Studio 的最终用户许可协议 = centos7
) 上支持 enable_intel_hpc_platform 设置。
默认值为 false
。
enable_intel_hpc_platform = true
注意
该enable_intel_hpc_platform参数与AWS基于 Graviton 的实例不兼容。
注意
AWS ParallelCluster版本 2.5.0enable_intel_hpc_platform 中添加了对的Support。
encrypted_ephemeral
(可选)使用 LUKS(Linux 统一密钥设置)对具有不可恢复的内存中密钥的临时实例存储卷进行加密。
有关更多信息,请参阅https://gitlab.com/cryptsetup/cryptsetup/blob/master/README.md
默认值为 false
。
encrypted_ephemeral = true
ephemeral_dir
(可选)定义使用实例存储卷时的装载路径。
默认值为 /scratch
。
ephemeral_dir = /scratch
extra_json
(可选)定义合并到的额外 JSONChefdna.json
。有关更多信息,请参阅构建自定义 AWS ParallelCluster AMI:
默认值为 {}
。
extra_json = {}
注意
从AWS ParallelCluster版本 2.6.1 开始,在启动节点以缩短启动时间时,默认情况下会跳过大多数安装方案。要以牺牲启动时间为代价运行所有安装配方"skip_install_recipes" : "no"
以获得更好的向后兼容性,请在extra_json设置中添加cluster
密钥。例如:
extra_json = { "cluster" : { "skip_install_recipes" : "no" } }
fsx_settings
(可选)指定定义 FsX for Lustre 配置的部分。分区名称必须以字母开头,并且仅包含字母、数字、连字符 (-) 和下划线 (_)。
有关更多信息,请参阅[fsx]部分。
例如,以下设置指定开头部分用[fsx fs]
于 FsX for Lustre 配置。
fsx_settings = fs
iam_lambda_role
(可选)定义现有AWS Lambda执行角色的名称。此角色附加到集群中所有 Lambda 函数。有关更多信息,请参阅《AWS Lambda 开发人员指南》中的 AWS Lambda 执行角色。
注意
从 2.11.5 版本开始,AWS ParallelCluster不支持使用SGE或Torque调度程序。
IAM 角色名称及其 Amazon 资源名称 (ARN) 是不同的。ARN 不能用作的参数iam_lambda_role
。如果同时ec2_iam_role定义了和,并且scheduler是sge
slurm
torque
、或,则不会创建任何角色。iam_lambda_role
如果scheduler是awsbatch
,则将在此期间创建角色pcluster start。例如策略,请参阅ParallelClusterLambdaPolicy使用SGESlurm、或Torque和ParallelClusterLambdaPolicy,使用 awsbatch。
没有默认值。
iam_lambda_role = ParallelClusterLambdaRole
注意
AWS ParallelCluster版本 2.10.1 中添加了对的Support。iam_lambda_role
initial_queue_size
(可选)设置要在集群中作为计算节点启动的 Amazon EC2 实例的初始数量。如果定义了queue_settings设置,则必须删除此设置并将其替换为[compute_resource]部分中的initial_count设置。
注意
从 2.11.5 版本开始,AWS ParallelCluster不支持使用SGE或Torque调度程序。
此设置仅适用于传统计划程序(SGE、Slurm 和 Torque)。如果maintain_initial_size设置为true
,则该initial_queue_size设置必须至少为一 (1)。
如果计划程序是 awsbatch
,请改用 min_vcpus。
默认值为 2
。
initial_queue_size = 2
key_name
(可选)命名用于支持对实例进行 SSH 访问的现有 Amazon EC2 key pair。
key_name = mykey
注意
在AWS ParallelCluster版本 2.11.0 之前,key_name
是必需的设置。
maintain_initial_size
注意
从 2.11.5 版本开始,AWS ParallelCluster不支持使用SGE或Torque调度程序。
(可选)保持传统调度程序 Auto Scaling 组的初始大小(SGESlurm、和Torque)。
如果计划程序是 awsbatch
,请改用 desired_vcpus。
此设置是一个布尔标记。如果设置为true
,则 Auto Scaling 组的initial_queue_size成员数永远不会少于的值,并且的值initial_queue_size必须大于一 (1)。集群仍可以扩展到 max_queue_size 的值。如果cluster_type = spot
这样,Auto Scaling 组的实例可能会中断,大小可能会降低initial_queue_size。
如果设置为false
,Auto Scaling 组可以缩减到零 (0) 个成员,以防止资源在不需要时处于闲置状态。
如果定义了queue_settings设置,则必须删除此设置并将其替换为[compute_resource]部分中的initial_count和min_count设置。
默认值为 false
。
maintain_initial_size = false
master_instance_type
(可选)定义用于头节点的 Amazon EC2 实例类型。实例类型的架构必须与用于compute_instance_type设置的架构相同。
如果AWS 区域有免费套餐,则默认为免费套餐实例类型(t2.micro
或t3.micro
)。其中AWS 区域没有免费套餐,默认为t3.micro
。有关AWS免费套餐的更多信息,请参阅AWS免费套餐常见问题
master_instance_type = t2.micro
注意
在AWS ParallelCluster版本 2.10.1 之前t2.micro
,默认为AWS 区域。在AWS ParallelCluster版本 2.10.0 中,头节点p4d.24xlarge
不支持。AWS ParallelCluster版本 2.8.0 中添加了对AWS基于 Graviton 的实例(例如A1
和C6g
)的Support。
master_root_volume_size
(可选)以千兆字节 (GiB) 为单位指定头节点根卷大小。AMI 必须支持 growroot
。
默认值为 35
。
注意
对于 2.5.0 和 2.10.4 之间的AWS ParallelCluster版本,默认值为 25。AWS ParallelCluster版本 2.2.2.版本 2.2.2.5.0 之前的版本
master_root_volume_size = 35
max_queue_size
(可选)设置集群中可以启动的 Amazon EC2 实例数。如果定义了queue_settings设置,则必须删除此设置并将其替换为[compute_resource]部分中的max_count设置。
注意
从 2.11.5 版本开始,AWS ParallelCluster不支持使用SGE或Torque调度程序。
此设置仅适用于传统计划程序(SGE、Slurm 和 Torque)。
如果计划程序是 awsbatch
,请改用 max_vcpus。
默认值为 10
。
max_queue_size = 10
更新策略:可以在更新期间更改此设置,但如果该值降低,则应停止计算队列。否则,现有节点可能会被终止。
max_vcpus
(可选)指定计算环境中 vCPUs 的最大数量。仅在计划程序为 awsbatch
时使用。
默认值为 20
。
max_vcpus = 20
min_vcpus
(可选)保持awsbatch
调度程序的 Auto Scaling 组的初始大小。
注意
从 2.11.5 版本开始,AWS ParallelCluster不支持使用SGE或Torque调度程序。
如果计划程序是 SGE、Slurm 或 Torque,请改用 maintain_initial_size。
计算环境中的成员数绝不会少于 min_vcpus 的值。
默认值为 0
。
min_vcpus = 0
placement
(可选)定义集群置放群组逻辑,使整个集群或仅允许计算实例使用集群置放组。
如果定义了queue_settings设置,则应删除此设置并将其替换为每个[queue]部分的placement_group设置。如果将同一个置放群组用于不同的实例类型,则请求更有可能由于容量不足错误而失败。有关更多信息,请参阅《适用于 Linux 实例的 Amazon EC2 用户指南》中的实例容量不足。只有事先创建一个置放群组并在每个队列的placement_group设置中进行配置,多个队列才能共享该群组。如果每个[queue]部分都定义了一个placement_group设置,则头节点不能在队列的置放群组中。
有效选项是 cluster
或 compute
。
当调度器处于调度器状态时,不使用此参数awsbatch
。
默认值为 compute
。
placement = compute
placement_group
(可选)定义集群置放群组。如果定义了queue_settings设置,则应删除此设置并将其替换为[queue]部分中的placement_group设置。
有效选项为以下值:
-
DYNAMIC
-
现有的 Amazon EC2 集群置放群组名称
当设置为 DYNAMIC
时,将唯一置放群组作为集群堆栈的一部分进行创建和删除。
当调度器处于调度器状态时,不使用此参数awsbatch
。
有关置放群组的更多信息,请参阅《适用于 Linux 实例的 Amazon EC2 用户指南》中的置放群组。如果将同一个置放群组用于不同的实例类型,则请求更有可能由于容量不足错误而失败。有关更多信息,请参阅《适用于 Linux 实例的 Amazon EC2 用户指南》中的实例容量不足。
没有默认值。
并非所有实例类型都支持集群置放群组。例如,的默认实例类型t3.micro
不支持集群置放群组。有关支持集群置放群组的更多信息,请参阅《适用于 Linux 实例的 Amazon EC2 用户指南》中的集群置放群组规则和限制。有关使用置放群组时的提示,请参阅置放群组和实例启动问题。
placement_group = DYNAMIC
post_install
(可选)指定在所有节点引导操作完成后运行的安装后脚本的 URL。有关更多信息,请参阅自定义引导操作:
当用awsbatch
作调度程序时,安装后脚本仅在头节点上运行。
参数格式可以是 http://
或 hostname/path/to/script.sh
s3://
。bucketname/path/to/script.sh
没有默认值。
post_install = s3://
<bucket-name>
/my-post-install-script.sh
post_install_args
(可选)指定要传递给安装后脚本的带引号的参数列表。
没有默认值。
post_install_args = "
argument-1
argument-2
"
pre_install
(可选)指定在启动任何节点部署引导操作之前运行的预安装脚本的 URL。有关更多信息,请参阅自定义引导操作:
当用awsbatch
作调度程序时,预安装脚本仅在头节点上运行。
参数格式可以是 http://
或 hostname/path/to/script.sh
s3://
。bucketname/path/to/script.sh
没有默认值。
pre_install = s3://
<bucket-name>
/my-pre-install-script.sh
pre_install_args
(可选)指定要传递给预安装脚本的带引号的参数列表。
没有默认值。
pre_install_args = "
argument-3
argument-4
"
proxy_server
(可选)通常定义 HTTP 或 HTTPS 代理服务器http://
。x.x.x.x:8080
没有默认值。
proxy_server = http://
10.11.12.13:8080
queue_settings
(可选)指定集群使用队列而不是同构计算队列,以及使用哪些[queue]部分。列出的第一[queue]部分是默认调度器队列。分queue
区名称必须以小写字母开头,并且仅包含小写字母、数字和字符 (-)。
重要
queue_settings仅在设置scheduler为时才支持slurm
。不得指定cluster_typecompute_instance_typeinitial_queue_sizemaintain_initial_sizemax_queue_size、placement、placement_group、、、和spot_price设置。disable_hyperthreading和enable_efa设置可以在[queue]分[cluster]区或部分中指定,但不能同时在两者中指定。
最多支持五(5)个[queue]部分。
有关更多信息,请参阅[queue]部分。
例如,以下设置指定了开头[queue q1]
和[queue q2]
使用的部分。
queue_settings = q1, q2
注意
AWS ParallelCluster版本 2.9.0 中添加了对的Support。queue_settings
raid_settings
(可选)使用亚马逊 EBS 卷 RAID 配置标识该[raid]
部分。分区名称必须以字母开头,并且仅包含字母、数字、连字符 (-) 和下划线 (_)。
有关更多信息,请参阅[raid]部分。
例如,以下设置指定[raid rs]
将开始部分用于 Auto Scaling 配置。
raid_settings = rs
s3_read_resource
(可选)指定向AWS ParallelCluster节点授予只读访问权限的 Amazon S3 资源。
例如,arn:aws:s3:::
提供对 my_corporate_bucket
*my_corporate_bucket
存储段和存储段中对象的只读访问权限。
没有默认值。
s3_read_resource = arn:aws:s3:::
my_corporate_bucket
*
s3_read_write_resource
(可选)指定向AWS ParallelCluster节点授予读/写访问权限的 Amazon S3 资源。
例如,arn:aws:s3:::
提供对 my_corporate_bucket
/Development/*my_corporate_bucket 存储段
文件夹中所有对象的读取/写入权限。Development
没有默认值。
s3_read_write_resource = arn:aws:s3:::
my_corporate_bucket
/*
scaling_settings
标识具有 Auto Scaling 配置的[scaling]
部分。分区名称必须以字母开头,并且仅包含字母、数字、连字符 (-) 和下划线 (_)。
有关更多信息,请参阅[scaling]部分。
例如,以下设置指定起始部分用[scaling custom]
于 Auto Scaling 配置。
scaling_settings = custom
scheduler
(必需)定义集群计划程序。
有效选项为以下值:
awsbatch
-
AWS Batch
有关
awsbatch
调度程序的更多信息,请参阅网络设置和AWS Batch (awsbatch)。 sge
-
注意
从 2.11.5 版本开始,AWS ParallelCluster不支持使用SGE或Torque调度程序。
Son of Grid Engine (SGE)
slurm
-
Slurm Workload Manager (Slurm)
torque
-
注意
从 2.11.5 版本开始,AWS ParallelCluster不支持使用SGE或Torque调度程序。
Torque Resource Manager (Torque)
注意
在AWS ParallelCluster版本 2.7.0 之前,该scheduler
参数是可选的,默认值为sge
。从AWS ParallelCluster版本 2.7.0 开始,该scheduler
参数是必填的。
scheduler = slurm
shared_dir
(可选)定义共享的 Amazon EBS 卷的装载路径。
不要对多个 Amazon EBS 卷使用此选项。相反,请在每个[ebs]部分下提供shared_dir值。
有关使用多个 Amazon EBS 卷的详细信息,请参阅[ebs]部分。
默认值为 /shared
。
以下示例显示了安装在 Amazon EBS 的共享卷/myshared
。
shared_dir = myshared
spot_bid_percentage
(可选)设置用于计算调度程序的最高现货价格的 ComputeFleet按需百分比。awsbatch
如果未指定,则选择当前 Spot 市场价格,最高为按需价格。
spot_bid_percentage = 85
spot_price
注意
从 2.11.5 版本开始,AWS ParallelCluster不支持使用SGE或Torque调度程序。
(可选)为传统调度程序设置最高竞价价格(SGESlurm、和Torque)。 ComputeFleet 仅当 cluster_type 设置设为 spot
时使用。如果您未指定值,则按现货价格收费,上限为按需价格。如果定义了queue_settings设置,则必须删除此设置并将其替换为[compute_resource]部分中的spot_price设置。
如果计划程序为 awsbatch
,请改用 spot_bid_percentage。
要获得有关查找满足您需求的竞价型实例的帮助,请咨询竞价型实例顾问
spot_price = 1.50
注意
在AWS ParallelCluster版本 2.5.0 中,如果spot_price未指定cluster_type = spot
但未指定,则实例将在失 ComputeFleet 败时启动。2.AWS ParallelCluster 版本 2.2.2.版本 2.2.2.2.版本 2.2.2.2.2.版本
tags
(可选)定义要使用的标签AWS CloudFormation。
如果通过 --tags 指定了命令行标签,则它们将与配置标签合并。
命令行标签覆盖具有相同键的配置标签。
标签是 JSON 格式的。不要在花括号之外使用引号。
有关更多信息,请参阅AWS CloudFormation用户指南中的AWS CloudFormation资源标签类型。
tags = {"key" : "value", "key2" : "value2"}
注意
更新策略不支持更改AWS ParallelCluster版本 2.8.0 到 2.9.1 的tags
设置。
对于版本 2.10.0 到 2.11.7,列出的支持更改tags
设置的更新策略不准确。不支持修改此设置时进行集群更新。
template_url
(可选)定义用于创建集群的AWS CloudFormation模板的路径。
更新使用最初用于创建堆栈的模板。
默认值为 https://
。aws_region_name
-aws-parallelcluster.s3.amazonaws.com/templates/aws-parallelcluster-version
.cfn.json
警告
这是一个高级参数。对此设置进行任何更改需自行承担风险。
template_url = https://us-east-1-aws-parallelcluster.s3.amazonaws.com/templates/aws-parallelcluster-2.11.9.cfn.json
vpc_settings
(必需)标识部署集群的 Amazon VPC 配置[vpc]
部分。分区名称必须以字母开头,并且仅包含字母、数字、连字符 (-) 和下划线 (_)。
有关更多信息,请参阅[vpc]部分。
例如,以下设置指定起始部分用[vpc public]
于 Amazon VPC 配置。
vpc_settings = public