本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。
Elastic Fabric Adapter (EFA) 是一种用于加速高性能计算 (HPC) 应用程序的网络设备。如果满足以下条件,则 AWS Batch 支持使用 EFA 的应用程序。
-
有关支持的实例类型列表 EFAs,请参阅 Amazon EC2 用户指南中的支持的实例类型。
提示
要查看 EFAs 中支持的实例类型列表 AWS 区域,请运行以下命令。然后,交叉引用 AWS Batch 控制台中返回的列表和可用实例类型列表。
$
aws ec2 describe-instance-types --region
us-east-1
--filters Name=network-info.efa-supported,Values=true --query "InstanceTypes[*].[InstanceType]" --output text | sort -
如需了解支持 EFA 的操作系统列表,请参阅支持的操作系统。
-
AMI 加载了 EFA 驱动程序。
-
EFA 的安全组必须允许进出安全组本身的所有入站和出站流量。
-
使用 EFA 的所有实例都必须位于同一集群置放群组中。
-
作业定义必须包含
devices
成员,其hostPath
设置为/dev/infiniband/uverbs0
,以允许将 EFA 设备传递到容器。如果指定了containerPath
,则它还必须设置为/dev/infiniband/uverbs0
。如果设置了permissions
,则它必须设置为READ
|WRITE
|。MKNOD
对于多节点 parallel 作业和单节点容器作业,LinuxParameters成员的位置不同。以下示例显示了差异,但缺少必填值。
例 多节点并行作业的示例
{ "jobDefinitionName": "EFA-MNP-JobDef", "type": "multinode", "nodeProperties": { ... "nodeRangeProperties": [ { ... "container": { ... "linuxParameters": { "devices": [ { "hostPath": "/dev/infiniband/uverbs0", "containerPath": "/dev/infiniband/uverbs0", "permissions": [ "READ", "WRITE", "MKNOD" ] }, ], }, }, }, ], }, }
例 单节点容器作业的示例
{ "jobDefinitionName": "EFA-Container-JobDef", "type": "container", ... "containerProperties": { ... "linuxParameters": { "devices": [ { "hostPath": "/dev/infiniband/uverbs0", }, ], }, }, }
有关 EFA 的更多信息,请参阅 Amazon EC2 用户指南中的弹性结构适配器。